2014年6月14日土曜日

HTMLパーサ

A WHATWG-compliant HTML parser with CSS selectors in Objective-C and Foundation. It parses HTML just like a browser.


使用例
#import 

NSString *html = @"<p><b>Ahoy there sailor!</b></p>";
HTMLDocument *document = [HTMLDocument documentWithString:html];
NSLog(@"%@", [document firstNodeMatchingSelector:@"b"].textContent); // => Ahoy there sailor!

作った理由は
・libxml2はHTML4対象で、壊れたHTMLが扱えない(libxml2を使う他のライブラリも同じ)
・WebKitのパース機能はプライベートAPI
・Google Toolbox for Mac はモダンブラウザのように動かない
等々

パフォーマンスにも気を使ってるとのこと。

0 件のコメント:

コメントを投稿