phpQueryでスクレイピング①:情報を取得して表示してみる

Backend

こんにちは、もぐのサダノです。



『他サイトから情報を持ってきて表示する』という案件がございまして、
そんなことできるのかとドキドキしていたのですが、
調べてみたらライブラリ的なものが用意されており、
案外シンプルに実装できました、



phpQueryを使ったスクレイピングについて、何回かにわけて記事を書こうと思います。



この記事では、情報を取得してそのまま表示するところまでを記します。
4ステップでできます。



①phpQueryの準備

1.以下のサイトからphpQueryOnefileをダウンロードします
https://code.google.com/archive/p/phpquery/downloads
2.ダウンロードしたファイルを解凍してプロジェクト内に配置します







②phpQueryの読み込み

スクレイピングプログラムを記述するページで以下のように書きます

<?php
 require 'phpQuery-onefile.php';
?>
connaiconnai

③情報を取得する

$html=file_get_contents('○○');  //○○=URL


file_get_contents(‘https://www.google.co.jp/’);
と書いても良いですし、

$url=https://www.google.co.jp/
file_get_contents($url);
と二行にしても良いですね。


④取得した情報の表示

では最後に取得した情報を表示して確認してみましょう。

echo $これはphpスクレイピングのテストページです。;
echo $html;



以上、phpQueryを使って他サイトから情報を持ってきて表示するスクレイピングの方法でした。



最後にコードを全文載せておきます。

<?php
 require 'phpQuery-onefile.php';
 $html=file_get_contents('○○');  //○○=URL
 echo $これはphpスクレイピングのテストページです。;
 echo $html;
?>




次の記事では全て表示するのではなく必要な文字列だけを表示してみます。

コメント

タイトルとURLをコピーしました