Webページ上にある文字の取得について
2019-08-07 14:09
Webページ上に表示された文字を取得するアクション作成について、教えて欲しいことがあります。
現在、試験的にYahoo!のTOPページ(https://www.yahoo.co.jp)から情報を取得しようとしています。
CELFのアクション「画面項目から値を取得する」を利用して、指定領域から文字を取得したいのですが、場所によって取得できる範囲が異なります。
【枠内の全ての文字が取得できる】
「ニュース」「経済」「エンタメ」の枠内にある文字(指定すると全て取得できる)
【枠内の一部の文字のみが取得できる】
「あなたへのおすすめ」の枠内にある文字(1項目ずつしか取得できない)
目標としては、「あなたへのおすすめ」の枠内全ての文字が取得できるようになりたいです。
双方の違いについて、回答していただけないでしょうか。
よろしくお願いします。
回答を投稿するにはログインが必要です。
なるほど。。。
構造が異なっているせいで、1つずつ取得しないと駄目なのですね。
ご回答ありがとうございました!
構造が異なっているせいで、1つずつ取得しないと駄目なのですね。
ご回答ありがとうございました!
ベストアンサー
「構造解析を使用して…」という機能で、そのyahooのページの画面全体をご覧になると、画像のようなツリー図が出ます。
http://celf.scskinfo.jp/celf-rpa-help/ja/texts/tips/uicontrol_register/index.html
青い枠(ニュースのところ)は、ニュースの項目が、「領域(リスト)」のなかの子属性の項目としてツリーになっています。
なので、そのニュース一覧の親項目の「領域(リスト)」のところを取得したら全部取得できます。
赤い枠(あなたへのおすすめのところ)は、このコーナー全体が親項目の下にまとまっているような構造になっていません。
なので1個ずつ取得しないとしょうがないです。
……こんな感じで答えになっていますでしょうか。
周りにWeb屋さんの素養のあるかたがいらっしゃったら、そのかたに構造を聞いてみるのが早いと思います。
http://celf.scskinfo.jp/celf-rpa-help/ja/texts/tips/uicontrol_register/index.html
青い枠(ニュースのところ)は、ニュースの項目が、「領域(リスト)」のなかの子属性の項目としてツリーになっています。
なので、そのニュース一覧の親項目の「領域(リスト)」のところを取得したら全部取得できます。
赤い枠(あなたへのおすすめのところ)は、このコーナー全体が親項目の下にまとまっているような構造になっていません。
なので1個ずつ取得しないとしょうがないです。
……こんな感じで答えになっていますでしょうか。
周りにWeb屋さんの素養のあるかたがいらっしゃったら、そのかたに構造を聞いてみるのが早いと思います。