【自分用メモ】RubyでNokogiriを使ってスクレイピングする時に役に立ったサイトまとめ
大体ここらへんを見れば書き方がわかった。
- クローラ作成に必須!XPATHの記法まとめ
- liの任意の番目の要素を取得する方法とかも載っていて◯
- Nokogiriを使用したクローラーめも
- メソッド一覧が載っていて◯
- RubyのNokogiriを使ってサイトをスクレイピングする
- 使い方の例が載っていて参考になる
- RubyでWebスクレイピング
- ここも使い方の例がいくつか載っている。例を見て真似するのが一番早い
- Nokogiriで文字化けを防ぐ
- 取り敢えず
require 'kconv'
して、Nokogiri::HTML.parse(html.toutf8, nil, 'utf-8')
しとけばOK
- 取り敢えず
- Getting attribute's value in Nokogiri to extract link URLs
- aタグ要素を持ってくる時に参考になった