四海のほとり

投稿

7月, 2022の投稿を表示しています

三年ぶりのベトナム行き直前の近況

7月 30, 2022

あと10日程で三年ぶりのベトナム行きとなる。三年前、私はベトナムから帰ってきてこんな記事を書いた。「ベトナム語：今回もほとんど通じなかった件（南部と北部の発音）」三年前、そこそこ自分なりにベトナム語を頑張って勉強したつもりであったが、ほぼ全く聴き取れず会話にならなかったことについて、主にアプリで学習した北部発音と自分が毎回訪れている南部では全然発音が異なる事を要因として挙げていた。さて、その後もベトナム語についていろんな記事を書いているので、その後どのように考えて学習を行っていたかは過去の記事を読み返せばわかる。コロナ騒ぎによって三年間ベトナムに行けなかったわけであるが、その間、以前にもましてベトナム語の学習を頑張ったのは間違いない。一応、ホーチミン人文社会科学大学のベトナム語能力試験をオンラインで受けてA2を取得することは出来た。試験は南部発音だったのでこの三年間南部発音を中心に学習してきたことはプラスに働いた。そして、いよいよ三年ぶりのベトナム、実際に現地で南部発音を聴き取れるのか？　考えるとドキドキする。この三年間、オンラインレッスンで何度も何度も発音練習を繰り返していた。だが、実際にスムーズに会話できるようになったかというと、そうでもない。いや、そうでもないどころではない、未だかなり低レベルな会話しか出来ない。要因としてはテキストに沿った発音練習がメインで、本当に自由な会話はさほどしていなかった。それに、教えてもらった言葉や文法を繰り返し練習していなかった。なので記憶に定着しておらず、いざというときに出てこないので会話が止まってしまう。これは最近、過去のレッスンメモを見返していてすごく実感した。復習と実践がまだ全然足りていない。それに気がついて、過去のレッスンメモを見ながらレッスン動画を見返し、教えてもらった単語を単語帳に追加するという事をやり始めたのがつい最近そんな状況の中で、これから私は積極的に新しい先生とオンラインレッスンを行っていく予定。ベトナム行き直前で悪あがきっぽいけど、まぁでもやれることはやっておいたほうが良いと思う。どうせだから以前からYouTubeでよく知っている先生にお願いすることにした。ベトナムから帰ってきたときに、三年前と同じ内容のブログを書かないで済むように今頑張るしか無い！

Googleスプレッドシートのimportxml関数で2つの越越辞書を自動取得して比較

7月 16, 2022

過去に何度かGoogleスプレッドシートのimportxml関数を使った記事を書いた。今回も同様にWeb上で使える辞書を自動検索してスプレッドシートに取り込もうというのが趣旨。当初はWiktionaryをAPIで呼び出す計画であった。しかし、やってみると意外と苦戦した。 WiktionaryはWikipediaAPIと同じ仕様なので記事タイトルなどは簡単に取得できたが、記事の内容は構造が複雑で、単語によって構造が違う為一律のルールで取得する事は出来なかった。なので、Wiktionaryからデータを取得するのは諦めた。その後はベトナム語の辞書サイトでviệt-việt （ベトベト、越越）があるサイトを一つずつ取り込めるか試していった。結果、2つのサイトから取り込むことが出来た。なんで越日（ベトナム語→日本語）ではなく越越（ベトナム語→ベトナム語）辞書なのかというと、越日の場合、収録語数が少ないからである。ただ越越辞書を取得するだけでは面白くないのでGoogleスプレッドシートのgoogletranslate関数で同時に日本語訳を表示するようにした。ここでは、以前作成した自作関数ではなく、Googleスプレッドシート標準の翻訳関数を用いている。正直、標準の翻訳関数は翻訳精度が低いので精度の改善のためには以前作成した翻訳関数を使うか、みんなの自動翻訳を呼び出す新しい関数を作るべきだと思う。だが、まぁ越越辞書を頑張って読むのも勉強になるから日本語訳は補足だと思えばそれほど翻訳精度を気にする必要はない。辞書サイトを直接使ってももちろん調べられるのだけど、2つの辞書サイトから自動取得することで、一回の検索で2種類の説明が見られること、自動で日本語訳も出るので、意味がわからないときの補足になる事が多少のメリットであろうか。今回ちょっと苦労したのはサイトによっては例文が異なるhtml構造になっていて、その為にxpathを複数記述する必要があったこと。まぁxpathの複数記述は以前のimportxml関数の記事でも書いたと思うのでここであんまり記してもしょうがないのだけど、2つのimportxml関数はこのように記述した。 #1 =IMPORTXML("http://tratu.coviet.vn/hoc-tieng-anh/tu-dien/l...

自分の単語帳を作る場所は検索精度で選ぶべきか？

7月 05, 2022

言語学習において自分の単語帳を作るのがおすすめであると昔読んだ本に書いてあった。確かに自分がレッスンで教えてもらった単語は教えてもらった用例と一緒に残すことで記憶に残りやすいし、忘れても後から確認することが出来る。単語帳は紙のノートで作ることも出来るが、いつでもどこでも調べたい、確認したいと思うならクラウドベースのサービスに作成しておくべきだろう。そこで手っ取り早く思いつくのはGoogleスプレッドシートになるだろう。本格的なデータベースに記録してもよいが、表計算ソフトであるスプレッドシートなら気軽に誰でも利用できるし、GoogleスプレッドシートにはQuery関数というスプレッドシートを簡易データベースのように利用できる独自関数が用意されている。 Googleスプレッドシートなら出先でモバイルアプリからアクセスしても高速だし、家にいる時はPCからキーボードで入力すれば単語登録は素早く行える。単語帳の記録場所として最適かと思えた。ドキュメントと検索の比較をするまでは・・・。 Query関数を使ったような検索ではなく、普通にメニューに存在する「検索と置換」機能で検索した場合、スプレッドシートだとセルが選ばれるだけで、単語自体が選択されるわけではない。一つのセルにたくさん文字が入っている場合、検索した単語がどこにあるかわかりにくい。これらの単語をGoogleドキュメントに貼り付けて、同様に「検索と置換」で「đồ」を検索してみるとこの様になる。「đồ」が含まれる３ヶ所で該当文字がわかるようにマークされている。ぱっと見て、ドキュメントのほうが文字列検索した時の表示がわかりやすい事がはっきりわかる。それに加えてスプレッドシートには無いチェックボックス、「ラテン文字の発音区分記号を無視する」が存在する。これは前回の電子書籍についての記事でも少し触れたが、記号を入力できない環境や、記号を正確に覚えていない時は無視するをチェックすれば検索出来るし、正確に記憶している場合は無視するのチェックを外せば正しい検索結果になる。状況に応じて適切な検索が可能になる便利な機能であり、スプレッドシートにはこれが無いので、この点でもドキュメントの方が優れている。正規表現での検索 Googleドキュメント、スプレッドシートともに「検索と置換」のチェックボックスに「...