A WHATWG-compliant HTML parser with CSS selectors in Objective-C and Foundation. It parses HTML just like a browser.
使用例
#importNSString *html = @"<p><b>Ahoy there sailor!</b></p>"; HTMLDocument *document = [HTMLDocument documentWithString:html]; NSLog(@"%@", [document firstNodeMatchingSelector:@"b"].textContent); // => Ahoy there sailor!
作った理由は
・libxml2はHTML4対象で、壊れたHTMLが扱えない(libxml2を使う他のライブラリも同じ)
・WebKitのパース機能はプライベートAPI
・Google Toolbox for Mac はモダンブラウザのように動かない
等々
パフォーマンスにも気を使ってるとのこと。