#golang htmlパッケージについて

Posted by kwmt on Tue, Jun 25, 2013

htmlパッケージの使い方を学ぶために、 http://godoc.org/code.google.com/p/go.net/html を使ってGoogle検索した結果をリスト化するだけのプログラム作ってみました。

ソースは下記です。

kwmt/gosearch · GitHub https://github.com/kwmt/gosearch

注意

文字化けします。

逆にmetaを書かないと、Getで返ってきた文字は化けしません。基本的なところと思うのですが、対処方法が分からず。。。

分かる方、教えて頂けると助かりますm(__)m

上記解決しました。

mattnさんのつぶやきを参考にさせて頂きました。

mahoniaパッケージ(doc)をgetして、取得したTextを、Shift_JISからUTF-8に変換しました。

本当は、下記ブログのようにHTMLをパースしてキャラクタセットを得るべきだと思いますが、Shift_JISとわかっていることと、テストなので直接指定しました。(GitHub L99)

参考

Lingr のGo言語部屋に golang_bot 作った。
http://mattn.kaoriya.net/software/lang/go/20130411122207.htm


comments powered by Disqus