スクレイピングを用いた特許データ(Google Patent)のtextファイル作成の依頼・外注 | Webシステム開発・プログラミングの仕事・副業【ランサーズ】
スクレイピングを用いた特許データ(Google Patent)のtextファイル作成の依頼・外注 | Webシステム開発・プログラミングの仕事・副業【ランサーズ】
特許データから技術開発の変遷を解明する研究をしています。
今回Google Patentから10,541件の対象データをエクセルに抽出したのですが、特許本文に対してテキスト分析をかけたいと考えています。
以下は特許のひとつの例ですが、ページ内にある「Abstract」「Description」「Claims」を見出し付きでtxtデータにしたいというのが依頼となります。
https://patents.google.com/patent/JP2022048324A
(txtデータ例)
----------------
JP2022048324A
Abstract(要約)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇
Claims(請求項)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇
Description(説明)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇
-----------------
Google Patentは私が調べる限りはAPIが存在していないため、スクレピングで取得する必要がありそうです。
また、ファイル名は後で紐付けできるよう、エクセルのNoと合わせた形にしてください。
エクセルファイルに関しては依頼時にお渡しします。
今回Google Patentから10,541件の対象データをエクセルに抽出したのですが、特許本文に対してテキスト分析をかけたいと考えています。
以下は特許のひとつの例ですが、ページ内にある「Abstract」「Description」「Claims」を見出し付きでtxtデータにしたいというのが依頼となります。
https://patents.google.com/patent/JP2022048324A
(txtデータ例)
----------------
JP2022048324A
Abstract(要約)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇
Claims(請求項)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇
Description(説明)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇
-----------------
Google Patentは私が調べる限りはAPIが存在していないため、スクレピングで取得する必要がありそうです。
また、ファイル名は後で紐付けできるよう、エクセルのNoと合わせた形にしてください。
エクセルファイルに関しては依頼時にお渡しします。
ランサーズ システム開発・運用