投稿

三年ぶりのベトナム行き直前の近況

 あと10日程で三年ぶりのベトナム行きとなる。 三年前、私はベトナムから帰ってきてこんな記事を書いた。 「ベトナム語:今回もほとんど通じなかった件(南部と北部の発音)」 三年前、そこそこ自分なりにベトナム語を頑張って勉強したつもりであったが、ほぼ全く聴き取れず会話にならなかったことについて、主にアプリで学習した北部発音と自分が毎回訪れている南部では全然発音が異なる事を要因として挙げていた。 さて、その後もベトナム語についていろんな記事を書いているので、その後どのように考えて学習を行っていたかは過去の記事を読み返せばわかる。 コロナ騒ぎによって三年間ベトナムに行けなかったわけであるが、その間、以前にもましてベトナム語の学習を頑張ったのは間違いない。 一応、ホーチミン人文社会科学大学のベトナム語能力試験をオンラインで受けてA2を取得することは出来た。 試験は南部発音だったのでこの三年間南部発音を中心に学習してきたことはプラスに働いた。 そして、いよいよ三年ぶりのベトナム、実際に現地で南部発音を聴き取れるのか?  考えるとドキドキする。 この三年間、オンラインレッスンで何度も何度も発音練習を繰り返していた。 だが、実際にスムーズに会話できるようになったかというと、そうでもない。 いや、そうでもないどころではない、未だかなり低レベルな会話しか出来ない。 要因としてはテキストに沿った発音練習がメインで、本当に自由な会話はさほどしていなかった。 それに、教えてもらった言葉や文法を繰り返し練習していなかった。 なので記憶に定着しておらず、いざというときに出てこないので会話が止まってしまう。 これは最近、過去のレッスンメモを見返していてすごく実感した。 復習と実践がまだ全然足りていない。 それに気がついて、過去のレッスンメモを見ながらレッスン動画を見返し、教えてもらった単語を単語帳に追加するという事をやり始めたのがつい最近 そんな状況の中で、これから私は積極的に新しい先生とオンラインレッスンを行っていく予定。 ベトナム行き直前で悪あがきっぽいけど、まぁでもやれることはやっておいたほうが良いと思う。 どうせだから以前からYouTubeでよく知っている先生にお願いすることにした。 ベトナムから帰ってきたときに、三年前と同じ内容のブログを書かないで済むように今頑張るしか無い!

Googleスプレッドシートのimportxml関数で2つの越越辞書を自動取得して比較

イメージ
 過去に何度かGoogleスプレッドシートのimportxml関数を使った記事を書いた。 今回も同様にWeb上で使える辞書を自動検索してスプレッドシートに取り込もうというのが趣旨。 当初はWiktionaryをAPIで呼び出す計画であった。 しかし、やってみると意外と苦戦した。 WiktionaryはWikipediaAPIと同じ仕様なので記事タイトルなどは簡単に取得できたが、記事の内容は構造が複雑で、単語によって構造が違う為一律のルールで取得する事は出来なかった。 なので、Wiktionaryからデータを取得するのは諦めた。 その後はベトナム語の辞書サイトでviệt-việt (ベトベト、越越)があるサイトを一つずつ取り込めるか試していった。 結果、2つのサイトから取り込むことが出来た。 なんで越日(ベトナム語→日本語)ではなく越越(ベトナム語→ベトナム語)辞書なのかというと、越日の場合、収録語数が少ないからである。 ただ越越辞書を取得するだけでは面白くないのでGoogleスプレッドシートのgoogletranslate関数で同時に日本語訳を表示するようにした。 ここでは、以前作成した自作関数ではなく、Googleスプレッドシート標準の翻訳関数を用いている。 正直、標準の翻訳関数は翻訳精度が低いので精度の改善のためには以前作成した翻訳関数を使うか、みんなの自動翻訳を呼び出す新しい関数を作るべきだと思う。 だが、まぁ越越辞書を頑張って読むのも勉強になるから日本語訳は補足だと思えばそれほど翻訳精度を気にする必要はない。 辞書サイトを直接使ってももちろん調べられるのだけど、2つの辞書サイトから自動取得することで、一回の検索で2種類の説明が見られること、自動で日本語訳も出るので、意味がわからないときの補足になる事が多少のメリットであろうか。 今回ちょっと苦労したのはサイトによっては例文が異なるhtml構造になっていて、その為にxpathを複数記述する必要があったこと。 まぁxpathの複数記述は以前のimportxml関数の記事でも書いたと思うのでここであんまり記してもしょうがないのだけど、2つのimportxml関数はこのように記述した。 #1 =IMPORTXML("http://tratu.coviet.vn/hoc-tieng-anh/tu-dien/l...

自分の単語帳を作る場所は検索精度で選ぶべきか?

イメージ
 言語学習において自分の単語帳を作るのがおすすめであると昔読んだ本に書いてあった。 確かに自分がレッスンで教えてもらった単語は教えてもらった用例と一緒に残すことで記憶に残りやすいし、忘れても後から確認することが出来る。 単語帳は紙のノートで作ることも出来るが、いつでもどこでも調べたい、確認したいと思うならクラウドベースのサービスに作成しておくべきだろう。 そこで手っ取り早く思いつくのはGoogleスプレッドシートになるだろう。 本格的なデータベースに記録してもよいが、表計算ソフトであるスプレッドシートなら気軽に誰でも利用できるし、GoogleスプレッドシートにはQuery関数というスプレッドシートを簡易データベースのように利用できる独自関数が用意されている。 Googleスプレッドシートなら出先でモバイルアプリからアクセスしても高速だし、家にいる時はPCからキーボードで入力すれば単語登録は素早く行える。 単語帳の記録場所として最適かと思えた。 ドキュメントと検索の比較をするまでは・・・。 Query関数を使ったような検索ではなく、普通にメニューに存在する「検索と置換」機能で検索した場合、スプレッドシートだとセルが選ばれるだけで、単語自体が選択されるわけではない。 一つのセルにたくさん文字が入っている場合、検索した単語がどこにあるかわかりにくい。 これらの単語をGoogleドキュメントに貼り付けて、同様に「検索と置換」で「đồ」を検索してみるとこの様になる。 「đồ」が含まれる3ヶ所で該当文字がわかるようにマークされている。 ぱっと見て、ドキュメントのほうが文字列検索した時の表示がわかりやすい事がはっきりわかる。 それに加えてスプレッドシートには無いチェックボックス、「ラテン文字の発音区分記号を無視する」が存在する。 これは前回の電子書籍についての記事でも少し触れたが、記号を入力できない環境や、記号を正確に覚えていない時は無視するをチェックすれば検索出来るし、正確に記憶している場合は無視するのチェックを外せば正しい検索結果になる。 状況に応じて適切な検索が可能になる便利な機能であり、スプレッドシートにはこれが無いので、この点でもドキュメントの方が優れている。 正規表現での検索 Googleドキュメント、スプレッドシートともに「検索と置換」のチェックボックスに「...

電子書籍の文字列検索が期待外れだった件

イメージ
 前回、前々回と洋書の電子書籍が国内の電子書籍よりもずっと便利であることを記した。(iOSのブックアプリ、ブックストア利用) 確かに便利であるが、実際に何度も使ってみると見えてくる事もある。 電子書籍の便利さの一つの要素として単語や文節を検索できる事が挙げられる。 辞書の場合は見出し語だけではなく、例文も含めて検索が可能であり、紙の辞書では体験出来ない利便性を享受できる。 さて、その便利な検索ではあるが、実際に使ってみると検索システムに工夫が無い事に気がつく。 私は長く検索システムに関わっており、普通の人よりは詳しい方なので、その問題について記しておく。 これは「anh」で検索した例。 しかし、検索結果の上位に一つも「anh」が無いことに気がつく。 発生している問題は2つある、「anh」で「th anh 」等のanhを含む単語がヒットしている。 もう一つは声調や母音の種類を表す発音記号が無視されている。「anh」で「ảnh」がヒットしてしまっている。 このため関係ない単語が大量にヒットし、「anh」を含む単語を見つけるのが困難になっている。 こういうのを私は検索のノイズと呼んでいる。 「anh」の場合は二種類のノイズが同時発生した事で大量のノイズが発生した。 何故このような事になるのか? まず、より問題の大きい前者の部分一致について記す。 例えばGoogleスプレッドシートやドキュメントで検索しても検索精度は似たようなものであり、この結果を仕方ないと思う人もいるかもしれない。 ただ、それは大量の文書に対して検索することを前提としていないスプレッドシートやドキュメントでは許されるのであって、大量のテキストから検索する必要がある状況ではそれなりにちゃんとした検索システムを構築するべきである。 電子書籍のような数百ページの本から単語を検索する事が通常である環境ではちゃんとした検索システムを構築して欲しいと思う。 通常、データベースに対して全文検索を行う場合は、検索精度を向上させるために言語ごとに特化した調整が行われる。 英語やスペイン語等の欧米の言語では単語をスペースで区切る分かち書きが行われている。 なので、スペースを単語の区切りとして、単語が完全に一致するものをヒットするようにするのが一般的である。 そうすれば「ACE」で「SPACE」がヒットしてしまうような...

ベトナム語の電子書籍を購入したら更に便利だった件

イメージ
 前回、英語圏の電子書籍を購入してみたらとても便利だったことを記した。 ずっと便利に使っているけど、英語が得意ではないので絵の無い単語だと説明を読むのがちょっと手間。 そこで、そもそもベトナム語の電子書籍を探せばよいのではないかと気がついた。 ベトナム人向けの日本語学習サイト「 Mazii 」はプレミアム契約をしてしまうほどよく使っているのだから、電子書籍もベトナム人向けの日本語辞書を探せば良い。 早速、iPhoneのブックアプリで日本語を意味する tiếng nhật を検索 直ぐに出てきた! Sách từ vựng tiếng Nhật (日本語の語彙集) 3000語も収録されていて、僅か650円! 不安な場合はサンプルを見ることができる。 サンプルでも67ページも収録されている。 そして、これが日本人のベトナム語学習者にとっても有益だということはぱっと見てわかる。 早速、ベトナム語で検索 mèo (猫) mèo 猫だけではなく、mèo が含まれるcon gấu mèo アライグマもヒット! これは便利! では、逆に日本語で検索「猫」 問題なく、「猫」もヒット 便利過ぎる! 早速購入、一瞬で購入完了 閲覧開始 836ページもある といっても、これは画面サイズによって可変するページ数なので画面の小さいiPhone13miniではこのように多くなるけど、iPadProでみたら365ページだった。 そして、元となっている紙の本は240ページだと記されている。 結構大きなサイズの本なのだろう。 紙の本として持ち歩くのはかなり疲れそうだが、iPhoneなら胸ポケットに入るし、ちゃんと文字をテキストとして認識しているのでiPhoneに最適化されて表示されるので読みやすい。 そして、先に記したように検索はかなり便利 外出中でも、いつでもどこでもぱっと単語を検索できる それで、ほかに日本語関連の本がどれくらいあるのかとappleのブックアプリでブックストアを検索していたのだけど、探しづらい・・・。 ここはちょっと残念なポイント。tiếng とnhậtが含まれる本が次々と表示されてしまう。 tiếng とnhật が続いている場合に評価を上げて検索結果を最適化すれば良いのだけど、そうした工夫が無い。 しかもタイトルではなく説明の中に2つの単語が含まれているだけの本もたく...

日本の電子書籍と洋書の電子書籍の差に愕然とする(ベトナム語辞書)

イメージ
 最近、洋書の電子書籍を購入してみた。 買ったのはこちらの本 Vietnamese Visual Dictionary 要は絵付きのベトナム語辞書 絵がついているので英語がわからなくても何を意味しているのかわかるので購入。 金額も僅か500円ほどと非常に気軽に購入可能 私は日本で発行されたベトナム語に関する電子書籍は既にいくつか購入しているが、辞書の類はほとんど電子化されていない為購入していない。 まぁ電子書籍ではないがベトナム語の辞書アプリはいくつかあるので、それらはほとんど購入済みではある。 しかし全ての言葉が網羅されているわけではないので辞書はもっとたくさん欲しいと思っていた。 そこでこの格安の電子書籍があったので飛びついたという次第。 感想 まず、開いて直後、買ってよかったと思った。 まず、見やすい。appleのブックアプリなので一回購入すればiPhoneからでもiPad Proからでも簡単に開ける(※)のだけど、iPhone13miniで見てもiPad Pro(12.9インチ)で見ても見やすい。読みやすい。 ※さらにファミリー共有で家族の誰でも見られる iPhoneで見るとこんな感じで、画面に合わせて調整される。黄色になっている部分はテキストを選択してメモを行った箇所 そう、文字がちゃんとテキストとして扱われているので選択してメモをすることも出来る。 テキストデータとなっているという事がわかると当然試したくなるのが検索 tiền で検索すると、見出し語ではなくても説明の中にtiền が含まれる単語が次々と表示される。 これは便利! 紙の辞書ではこのような高速な検索は不可能だし、見出しではなく説明文の中にある文字列を探すのは困難。 この電子書籍では一瞬にしてその単語の活用事例を確認できてしまう。 まさに電子書籍のメリットが具現化されている。 紙の辞書ってでかくて重くて、文字が小さくて読みにくくて、探すのにも時間がかかって、と良い印象は殆ど無い。 それに対して場所を取らず、文字は適切な大きさで表示され拡大可能、素早く検索でき、見出し語ではなくても検索できてしまう電子辞書は利便性の塊りだと言える iPad Proで縦画面だとこんな感じ。 画面が広いので情報量が増える。 でも、まぁ辞書って色んな場面で調べたくなるものなので利用頻度はiPhoneの方が遥かに...

ホーチミン人文社会科学大学のベトナム語能力試験 結果

イメージ
4月に受けたホーチミン人文社会科学大学のベトナム語能力試験、結果についてツイートしている人を見かけたが、その後も私のところには特に連絡はない状態が続いていた。 気になって、試験の時にメールをやり取りした人にいつ結果がわかるのかとメールした。 すると、すぐに返答があり、オンラインで確認できるので確認用URLからログインしてほしいと記されていた。 そこで試験の時のIDとパスワードを再確認してログイン。 無事結果を見ることが出来た。 当然のことだけど、試験結果は全てベトナム語で書かれている。 A1,A2,B1,B2,C1,C2の6段階の結果が記されていると思っていたが、実際に見てみると違った。 まず、項目ごとの点数が記されている。 Nghe 聴解 2.55 Nói 口述 3.2 Đọc 読解 3.0 Viết 筆記 0.9 これは試験の仕様を確認すると10点満点でそれぞれ評価されている。 物凄く低い点数に見えるが、ABCランク共通のテストなのでiVPTで一番下のA1だった私にとっては当たり前の結果である。 重要なのは落ちたのか、それともA1か、まさかA2にはなれないだろうというのが私の想定であった。 Điểm trung bình 平均点 2.5/10 Xếp loại ランク Sơ cấp 2 Bậc năng lực 能力レベル Bậc 2/6 4項目の平均点が2.5、ランクは2番目、能力レベルも6段階の2番目 ん? 2番目? 1番目ならもっとも低いレベルのA1に合格した事になるが、2番目? ちょっと目を疑う。 A2だとしたら凄く嬉しいが、信じがたいのでまたメールで確認した。  sơ cấp 2 và Bậc 2/6 bằng A2 phải không?  sơ cấp 2 と Bậc 2/6 は A2 と等しいですか? すぐに返答があった Dạ đúng rồi anh nhé! はい、正しいですね! A2! 確証が得られた。遂に念願のA2を取得した! 改めて、試験の仕組みを再確認。 各項目10段階で評価される(小数点付きだけど) 4項目の平均点で能力が評価される 私の平均点は2.5なのでA2の基準2以上を上回っている! B1の基準である4には遠く及ばないのでまだまだなのは間違いない。 A2...