Q&A

回答の並べ替え:
投稿新規に質問を投稿する

Webページ上にある文字の取得について

k_shimizu k_shimizu

2019-08-07 14:09

枠内の全ての文字が取得できる場所
枠内の一部の文字のみが取得できる場所

Webページ上に表示された文字を取得するアクション作成について、教えて欲しいことがあります。

現在、試験的にYahoo!のTOPページ(https://www.yahoo.co.jp)から情報を取得しようとしています。
CELFのアクション「画面項目から値を取得する」を利用して、指定領域から文字を取得したいのですが、場所によって取得できる範囲が異なります。

 【枠内の全ての文字が取得できる】
 「ニュース」「経済」「エンタメ」の枠内にある文字(指定すると全て取得できる)

 【枠内の一部の文字のみが取得できる】
 「あなたへのおすすめ」の枠内にある文字(1項目ずつしか取得できない)

目標としては、「あなたへのおすすめ」の枠内全ての文字が取得できるようになりたいです。
双方の違いについて、回答していただけないでしょうか。
よろしくお願いします。

k_shimizu k_shimizu
なるほど。。。
構造が異なっているせいで、1つずつ取得しないと駄目なのですね。

ご回答ありがとうございました!
kurata kurata
メダルベストアンサー
青い四角枠が「ニュース」で赤い四角枠が「あなたへのおすすめ」
「構造解析を使用して…」という機能で、そのyahooのページの画面全体をご覧になると、画像のようなツリー図が出ます。
http://celf.scskinfo.jp/celf-rpa-help/ja/texts/tips/uicontrol_register/index.html

青い枠(ニュースのところ)は、ニュースの項目が、「領域(リスト)」のなかの子属性の項目としてツリーになっています。
なので、そのニュース一覧の親項目の「領域(リスト)」のところを取得したら全部取得できます。
赤い枠(あなたへのおすすめのところ)は、このコーナー全体が親項目の下にまとまっているような構造になっていません。
なので1個ずつ取得しないとしょうがないです。

……こんな感じで答えになっていますでしょうか。
周りにWeb屋さんの素養のあるかたがいらっしゃったら、そのかたに構造を聞いてみるのが早いと思います。