regex alternatifi olarak html parserlar da kullanabilirsin. daha kolay halledilebilir ileriye dönük işler ( farklı tagleri almak isterken tekrar yeni bir regex pattern yazmaya gerek kalmaz)
http://htmlparser.sourceforge.net/ http://jsoup.org/ http://java-source.net/open-source/html-parsers (burda baya link var)