投稿

三年ぶりのベトナムで感じた「聴き取れなかった」と「通じた」

イメージ
 コロナ騒ぎで遠ざかったていたベトナムに三年ぶりに行った。 最大の関心事はこの三年間頑張ってきたベトナム語が通じるかどうかということ。 そして、結果は残念ながら通じるとは言えなかった。 だが、進歩を実感できる場面も結構あった。 まず、駄目だった場面 ネイティブ同士の普通の会話を聴き取るのは困難であった。 南部弁同士の会話でも一部聴き取れる単語があるだけで全体として意味がわからなかったし、北部弁の会話は壊滅的に聴き取れなかった。 聴き取れなかった理由 南部弁を練習してきたと思っていたが、実際には努力が足りていなかった。 以前の記事にも書いている様に、Vの発音は基本ヴァ行で練習してきた。 しかし、実際に聞いているとヤ行で発音している方が一般的だった。 以前オンラインレッスンで、南部在住でも現在はVをヤ行で発音するのは3割程度と聞いていたので、なんとなく、Vはヴァ行で発音しておけば良いと思っていた。 でも、ヤ行で発音されると、練習していないので全く聴き取れない。 vào(ヴァオ)が(ヤオ)で耳に入ってきたら練習していないから何を言われたのかわからなくなる。 それに、vào の南部言葉vôが使われているのでますます聴き取れない。これも当然、ヤ行音で発音されているからヨーの発音となる。 オンラインレッスンでも、このあたりはずっとヴァ行音だったし、Dropsの文でもvô ではなくvào が使われていてヴァ行音だった。 全体として南部発音を練習していた筈であったが、本当に南部の言葉を聴き取るつもりならもっと完全に南部言葉を発音しておくべきだったとわかった。 このように南部発音の徹底不足、そして南部言葉の利用不足が聴き取れない要因の一つであった。 それ以外にも初歩的な文法と初歩的な言葉しか実際に会話で練習していないから、ちょっと複雑な会話になったり、口語独特の表現が入ってくるだけでわからない。 まぁとにかく聴き取れない、わからないが印象に残った。 さらに、私の周りでは完全な南部弁話者と北部弁話者が半々に近い割合でいた。 以前ははっきり聴き取れていなかったのでここまで実感していなかったが、よくよく個人個人の発音を注意して聴くと北部弁話者が結構いるとわかった。まぁたまたま北部からの来客2名がいたことも割合を高めてはいた。 当然ながら北部弁を早口(本人は普通)で喋られると、もう全...

サイクルコンピューターの電池を交換して積算距離を手入力

イメージ
 もうずっと前から使っている旧式のサイクルコンピューター クラウド連携とかしていないので電池を交換するときには現在の積算距離を確認してメモし、それを電池交換後入力しなければならない。 早め早めに交換しておけば問題ないのだけど、今回は(も?)画面表示が暗くなったところでまずいと気が付き、慌ててコンビニに寄ってCR2032を購入 そして、このブログの時間を使って交換することにした。 積算距離をなんとか確認 電池交換は簡単かと思ったらPanasonicのCR2032はハサミじゃないと切れない袋に入っており一苦労 手で開けようとしても開かないので鍵のギザギザを使ってノコギリのように切れ目を入れてそこから一気に開けることができた。 サイクルコンピューターのマニュアルは今は殆ど使っていないDropboxに入れてあることは覚えていたので問題なく操作を確認できた。 行うことは、まずタイヤの周長を入力すること。タイヤの写真をどこかに保存してあるはずだったけど、Googleフォトを見てもぱっと見つけられなかった。 と思ったら、積算距離と電池交換記録用のGoogleスプレッドシートにタイヤ周長もメモされていた💦 後は積算距離と現在時刻を入力 これで完了 この様に無事積算距離を引き継いでハッキリと画面が表示されるようになった。 38,452kmって結構な距離走っているなぁとも思うけど年間1,500Kmくらいしか走っていない。 昔より自転車で遠くまで行くことが減ったのが原因かな。 SPECIALIZEDのクロスバイクに乗り換えたのも、もう17年位前。 Googleフォトで自転車と検索するとすごいたくさん表示されて、一つ一つに思い出が呼び覚まされる。 過ぎ去った出来事を思い返して楽しい気分になれるように、また日々頑張らなければならないなと思う。

三年ぶりのベトナム行き直前の近況

 あと10日程で三年ぶりのベトナム行きとなる。 三年前、私はベトナムから帰ってきてこんな記事を書いた。 「ベトナム語:今回もほとんど通じなかった件(南部と北部の発音)」 三年前、そこそこ自分なりにベトナム語を頑張って勉強したつもりであったが、ほぼ全く聴き取れず会話にならなかったことについて、主にアプリで学習した北部発音と自分が毎回訪れている南部では全然発音が異なる事を要因として挙げていた。 さて、その後もベトナム語についていろんな記事を書いているので、その後どのように考えて学習を行っていたかは過去の記事を読み返せばわかる。 コロナ騒ぎによって三年間ベトナムに行けなかったわけであるが、その間、以前にもましてベトナム語の学習を頑張ったのは間違いない。 一応、ホーチミン人文社会科学大学のベトナム語能力試験をオンラインで受けてA2を取得することは出来た。 試験は南部発音だったのでこの三年間南部発音を中心に学習してきたことはプラスに働いた。 そして、いよいよ三年ぶりのベトナム、実際に現地で南部発音を聴き取れるのか?  考えるとドキドキする。 この三年間、オンラインレッスンで何度も何度も発音練習を繰り返していた。 だが、実際にスムーズに会話できるようになったかというと、そうでもない。 いや、そうでもないどころではない、未だかなり低レベルな会話しか出来ない。 要因としてはテキストに沿った発音練習がメインで、本当に自由な会話はさほどしていなかった。 それに、教えてもらった言葉や文法を繰り返し練習していなかった。 なので記憶に定着しておらず、いざというときに出てこないので会話が止まってしまう。 これは最近、過去のレッスンメモを見返していてすごく実感した。 復習と実践がまだ全然足りていない。 それに気がついて、過去のレッスンメモを見ながらレッスン動画を見返し、教えてもらった単語を単語帳に追加するという事をやり始めたのがつい最近 そんな状況の中で、これから私は積極的に新しい先生とオンラインレッスンを行っていく予定。 ベトナム行き直前で悪あがきっぽいけど、まぁでもやれることはやっておいたほうが良いと思う。 どうせだから以前からYouTubeでよく知っている先生にお願いすることにした。 ベトナムから帰ってきたときに、三年前と同じ内容のブログを書かないで済むように今頑張るしか無い!

Googleスプレッドシートのimportxml関数で2つの越越辞書を自動取得して比較

イメージ
 過去に何度かGoogleスプレッドシートのimportxml関数を使った記事を書いた。 今回も同様にWeb上で使える辞書を自動検索してスプレッドシートに取り込もうというのが趣旨。 当初はWiktionaryをAPIで呼び出す計画であった。 しかし、やってみると意外と苦戦した。 WiktionaryはWikipediaAPIと同じ仕様なので記事タイトルなどは簡単に取得できたが、記事の内容は構造が複雑で、単語によって構造が違う為一律のルールで取得する事は出来なかった。 なので、Wiktionaryからデータを取得するのは諦めた。 その後はベトナム語の辞書サイトでviệt-việt (ベトベト、越越)があるサイトを一つずつ取り込めるか試していった。 結果、2つのサイトから取り込むことが出来た。 なんで越日(ベトナム語→日本語)ではなく越越(ベトナム語→ベトナム語)辞書なのかというと、越日の場合、収録語数が少ないからである。 ただ越越辞書を取得するだけでは面白くないのでGoogleスプレッドシートのgoogletranslate関数で同時に日本語訳を表示するようにした。 ここでは、以前作成した自作関数ではなく、Googleスプレッドシート標準の翻訳関数を用いている。 正直、標準の翻訳関数は翻訳精度が低いので精度の改善のためには以前作成した翻訳関数を使うか、みんなの自動翻訳を呼び出す新しい関数を作るべきだと思う。 だが、まぁ越越辞書を頑張って読むのも勉強になるから日本語訳は補足だと思えばそれほど翻訳精度を気にする必要はない。 辞書サイトを直接使ってももちろん調べられるのだけど、2つの辞書サイトから自動取得することで、一回の検索で2種類の説明が見られること、自動で日本語訳も出るので、意味がわからないときの補足になる事が多少のメリットであろうか。 今回ちょっと苦労したのはサイトによっては例文が異なるhtml構造になっていて、その為にxpathを複数記述する必要があったこと。 まぁxpathの複数記述は以前のimportxml関数の記事でも書いたと思うのでここであんまり記してもしょうがないのだけど、2つのimportxml関数はこのように記述した。 #1 =IMPORTXML("http://tratu.coviet.vn/hoc-tieng-anh/tu-dien/l...

自分の単語帳を作る場所は検索精度で選ぶべきか?

イメージ
 言語学習において自分の単語帳を作るのがおすすめであると昔読んだ本に書いてあった。 確かに自分がレッスンで教えてもらった単語は教えてもらった用例と一緒に残すことで記憶に残りやすいし、忘れても後から確認することが出来る。 単語帳は紙のノートで作ることも出来るが、いつでもどこでも調べたい、確認したいと思うならクラウドベースのサービスに作成しておくべきだろう。 そこで手っ取り早く思いつくのはGoogleスプレッドシートになるだろう。 本格的なデータベースに記録してもよいが、表計算ソフトであるスプレッドシートなら気軽に誰でも利用できるし、GoogleスプレッドシートにはQuery関数というスプレッドシートを簡易データベースのように利用できる独自関数が用意されている。 Googleスプレッドシートなら出先でモバイルアプリからアクセスしても高速だし、家にいる時はPCからキーボードで入力すれば単語登録は素早く行える。 単語帳の記録場所として最適かと思えた。 ドキュメントと検索の比較をするまでは・・・。 Query関数を使ったような検索ではなく、普通にメニューに存在する「検索と置換」機能で検索した場合、スプレッドシートだとセルが選ばれるだけで、単語自体が選択されるわけではない。 一つのセルにたくさん文字が入っている場合、検索した単語がどこにあるかわかりにくい。 これらの単語をGoogleドキュメントに貼り付けて、同様に「検索と置換」で「đồ」を検索してみるとこの様になる。 「đồ」が含まれる3ヶ所で該当文字がわかるようにマークされている。 ぱっと見て、ドキュメントのほうが文字列検索した時の表示がわかりやすい事がはっきりわかる。 それに加えてスプレッドシートには無いチェックボックス、「ラテン文字の発音区分記号を無視する」が存在する。 これは前回の電子書籍についての記事でも少し触れたが、記号を入力できない環境や、記号を正確に覚えていない時は無視するをチェックすれば検索出来るし、正確に記憶している場合は無視するのチェックを外せば正しい検索結果になる。 状況に応じて適切な検索が可能になる便利な機能であり、スプレッドシートにはこれが無いので、この点でもドキュメントの方が優れている。 正規表現での検索 Googleドキュメント、スプレッドシートともに「検索と置換」のチェックボックスに「...

電子書籍の文字列検索が期待外れだった件

イメージ
 前回、前々回と洋書の電子書籍が国内の電子書籍よりもずっと便利であることを記した。(iOSのブックアプリ、ブックストア利用) 確かに便利であるが、実際に何度も使ってみると見えてくる事もある。 電子書籍の便利さの一つの要素として単語や文節を検索できる事が挙げられる。 辞書の場合は見出し語だけではなく、例文も含めて検索が可能であり、紙の辞書では体験出来ない利便性を享受できる。 さて、その便利な検索ではあるが、実際に使ってみると検索システムに工夫が無い事に気がつく。 私は長く検索システムに関わっており、普通の人よりは詳しい方なので、その問題について記しておく。 これは「anh」で検索した例。 しかし、検索結果の上位に一つも「anh」が無いことに気がつく。 発生している問題は2つある、「anh」で「th anh 」等のanhを含む単語がヒットしている。 もう一つは声調や母音の種類を表す発音記号が無視されている。「anh」で「ảnh」がヒットしてしまっている。 このため関係ない単語が大量にヒットし、「anh」を含む単語を見つけるのが困難になっている。 こういうのを私は検索のノイズと呼んでいる。 「anh」の場合は二種類のノイズが同時発生した事で大量のノイズが発生した。 何故このような事になるのか? まず、より問題の大きい前者の部分一致について記す。 例えばGoogleスプレッドシートやドキュメントで検索しても検索精度は似たようなものであり、この結果を仕方ないと思う人もいるかもしれない。 ただ、それは大量の文書に対して検索することを前提としていないスプレッドシートやドキュメントでは許されるのであって、大量のテキストから検索する必要がある状況ではそれなりにちゃんとした検索システムを構築するべきである。 電子書籍のような数百ページの本から単語を検索する事が通常である環境ではちゃんとした検索システムを構築して欲しいと思う。 通常、データベースに対して全文検索を行う場合は、検索精度を向上させるために言語ごとに特化した調整が行われる。 英語やスペイン語等の欧米の言語では単語をスペースで区切る分かち書きが行われている。 なので、スペースを単語の区切りとして、単語が完全に一致するものをヒットするようにするのが一般的である。 そうすれば「ACE」で「SPACE」がヒットしてしまうような...

ベトナム語の電子書籍を購入したら更に便利だった件

イメージ
 前回、英語圏の電子書籍を購入してみたらとても便利だったことを記した。 ずっと便利に使っているけど、英語が得意ではないので絵の無い単語だと説明を読むのがちょっと手間。 そこで、そもそもベトナム語の電子書籍を探せばよいのではないかと気がついた。 ベトナム人向けの日本語学習サイト「 Mazii 」はプレミアム契約をしてしまうほどよく使っているのだから、電子書籍もベトナム人向けの日本語辞書を探せば良い。 早速、iPhoneのブックアプリで日本語を意味する tiếng nhật を検索 直ぐに出てきた! Sách từ vựng tiếng Nhật (日本語の語彙集) 3000語も収録されていて、僅か650円! 不安な場合はサンプルを見ることができる。 サンプルでも67ページも収録されている。 そして、これが日本人のベトナム語学習者にとっても有益だということはぱっと見てわかる。 早速、ベトナム語で検索 mèo (猫) mèo 猫だけではなく、mèo が含まれるcon gấu mèo アライグマもヒット! これは便利! では、逆に日本語で検索「猫」 問題なく、「猫」もヒット 便利過ぎる! 早速購入、一瞬で購入完了 閲覧開始 836ページもある といっても、これは画面サイズによって可変するページ数なので画面の小さいiPhone13miniではこのように多くなるけど、iPadProでみたら365ページだった。 そして、元となっている紙の本は240ページだと記されている。 結構大きなサイズの本なのだろう。 紙の本として持ち歩くのはかなり疲れそうだが、iPhoneなら胸ポケットに入るし、ちゃんと文字をテキストとして認識しているのでiPhoneに最適化されて表示されるので読みやすい。 そして、先に記したように検索はかなり便利 外出中でも、いつでもどこでもぱっと単語を検索できる それで、ほかに日本語関連の本がどれくらいあるのかとappleのブックアプリでブックストアを検索していたのだけど、探しづらい・・・。 ここはちょっと残念なポイント。tiếng とnhậtが含まれる本が次々と表示されてしまう。 tiếng とnhật が続いている場合に評価を上げて検索結果を最適化すれば良いのだけど、そうした工夫が無い。 しかもタイトルではなく説明の中に2つの単語が含まれているだけの本もたく...