regex alternatifi olarak html parserlar da kullanabilirsin. daha kolay halledilebilir ileriye dönük işler ( farklı tagleri almak isterken tekrar yeni bir regex pattern yazmaya gerek kalmaz)

http://htmlparser.sourceforge.net/
http://jsoup.org/
http://java-source.net/open-source/html-parsers (burda baya link var)