スクレイピングを用いた特許データ(Google Patent)のtextファイル作成の依頼・外注 | Webシステム開発・プログラミングの仕事・副業【ランサーズ】

SEOを使わない爆速アクセスアップ術

スクレイピングを用いた特許データ(Google Patent)のtextファイル作成の依頼・外注 | Webシステム開発・プログラミングの仕事・副業【ランサーズ】
特許データから技術開発の変遷を解明する研究をしています。

今回Google Patentから10,541件の対象データをエクセルに抽出したのですが、特許本文に対してテキスト分析をかけたいと考えています。

以下は特許のひとつの例ですが、ページ内にある「Abstract」「Description」「Claims」を見出し付きでtxtデータにしたいというのが依頼となります。
https://patents.google.com/patent/JP2022048324A

(txtデータ例)
----------------
JP2022048324A

Abstract(要約)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇

Claims(請求項)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇

Description(説明)
〇〇〇〇〇〇〇〇〇〇〇〇〇〇
-----------------

Google Patentは私が調べる限りはAPIが存在していないため、スクレピングで取得する必要がありそうです。

また、ファイル名は後で紐付けできるよう、エクセルのNoと合わせた形にしてください。

エクセルファイルに関しては依頼時にお渡しします。

ランサーズ システム開発・運用

スクレイピングを用いた特許データ(Google Patent)のtextファイル作成の依頼・外注 | Webシステム開発・プログラミングの仕事・副業【ランサーズ】

応募する

SEOを使わない爆速アクセスアップ術