Googleスプレッドシートのimportxml関数でWikipedia API(単語の各言語表記を取得)
Googleスプレッドシートには他の表計算ソフトには無い独自の関数が多くある。 特に以前取り上げたtranslate(翻訳)関数や通貨レートをとってくるGoogleFinance関数(※)など、さすがインターネットと共に成長したGoogleと思わせるインターネットを利用した関数が特徴的である。 ※=A5*GoogleFinance("currency:JPYVND", "average") このようにすると日本円をベトナムドンに換算して表示してくれる。VNDJPYにすればベトナムドンを日本円に換算する。USDを指定すれば米ドルとなる。 その中で汎用的に様々な目的に使えて便利だが、ちょっと癖のあるimportxmlについて、自分の備忘録的に記しておくことにする。 importxmlはその名の通りxmlをインポートする事が目的となっているが、htmlでもxpathを指定する事で指定した要素を取得してセルに挿入できる。 例えばxml形式で返ってくるAPIを利用してスプレッドシートにデータを挿入するというのは一般的な活用方法だと思われる XMLの取得 まずは、htmlではなく、APIからxmlを取得する例を記しておく。 私が3年前に作成したが、既に自分は存在を忘れかけていた、WikipediaAPIを使って特定の単語の各言語表記を自動取得するスプレッドシートを見てもらいたい。 Wikipediaから多言語取得 利用方法 このスプレッドシートはA2セルになんらかの単語を入れると、その単語の各言語表記をWikipediaの記事タイトルから取得する仕組みとなっている。 シートはロックされているがA2セルはロックから除外しているので自由に単語を入れて使ってもらいたい。 コピーして使ってもらっても構わない。Googleスプレッドシートは誰でも無料で使えるので気軽に試してほしい。 実に単純な仕組みだがそこそこ便利だと思う。 A2にドラえもんと入力するとA3以降に各言語の表記が自動表示される 利用方法としてはA2に単語を入れるのみであるが、入れた単語がWikipedia日本語版の記事タイトルと完全一致しないと各言語表記は表示されない。 例えば「ドラえもん」は問題ないが「ヤマト」だと各言語表記は表示されない。 こうした場合に正しい記事タイトルがす