%表示はアナログ

%による表示はデジタルだと思っている人がいます。%は英語のper centで、perは割り合いを示す/の意味です。割り算の記号です。3分の2を2/3と書くのは2を3で割るという意味で、/は分数の記号でもあります。分数がアナログであることは以前に説明しました。セントcentは100という意味でcenturyは100年、1 centは1ドルの100分の1です。パーセントは「百で割ると」という記号で/100を記号化したのが%です。日本語訳は百分率といい、その意味を正確に反映しています。ある数の全体に占める割合を示すのに、すべてを百分率にして示すと比較に都合がよいのです。たとえば内閣の支持率で、毎回2351人中633人、2041人中601人のように示しても支持率が上がったのか下がったのか直観的にわかりません。そこで27%、29%のように表示すると支持率が上がっていることがわかります。しかし実人数は633人から601人に下がっています。これは調査人数が2351人から2041人と少なくなったことが影響していると考えられます。

もし調査人数が毎回同じであれば、単純人数比較でよいのですが、実際には同じ人を毎回揃えて調査することは不可能に近いです。調査対象者が病気や死亡、引越しなどで変化することもあります。調査人数の変動を平均化するための計算方法の1つが百分率表示です。原理的には千分率や万分率もあるのですが、実際に使われることは稀です。たとえば最近話題の新型コロナ(この名称も変えるべきです)による病床占有率も%表示で、それを指標として「まん延防止対策」の発動も決められています。しかし考えてみると、50床しかない地域の30%と20,000床の地域の30%では意味合いが全然違います。

多数決原理でも7人中4人と7,651人中の3,826人では同じ1人違いの過半数でも意味合いが全く違います。半数という概念もアナログの概念です。

このように現実世界ではかなりアナログ概念が浸透しているのですが、デジタル化=数値化という誤った概念誘導が見られ、その1つが%です。%は百分率つまり「母数を100とした割り合い」なので、まず母数が100以下では意味が弱いこと、また母数に大きな差がある場合には比較する指標としては正しくないということです。その差を埋める1つの技法が統計的検定で、いろいろな技法があります。自分で全部計算しようとするとかなり面倒な方程式を解くことになるのですが、今はExcelなどを利用した簡単な方法がありますから、いつか利用してみてください。

自分で統計的検定を利用する機会は少ないかもしれませんが、まずは%という数字のマジックにかからないようにすることが大切です。たとえば利益率、視聴率といった割り合いがよく示されますが、せめて母数をチェックすることをお勧めしたいです。

パーセント

統計による人工知能

AIブームの昨今ですが、かなり誤解も広がっています。AIはartificial intelligenceつまり人工知能の訳語です。そのため人間の知能を真似たもの、というところまでは合っています。問題は人間の知能のごく一部を利用したものであることで、実際には人間のその方面の知能の能力をはるかに超えています。しかし人間の知能のほんの一部であることは認識しておくべきです。

現在のAIの基本技術はdeep learning深層学習の技法です。深層学習理論の解説は結構難しいのですが、超簡単にいえば統計的な確率の集積です。AI学習が膨大なデータを必要とするのはそのせいです。反対にいうと膨大な量の処理は得意です。人間でいうと経験的知識がそれに該当しますが、人間の場合は比較的少ない量からでも学習します。しかしそのため人により同じ経験をしても得られる知見に差がでてきます。AIは確率の集積なので、機械の個体差に比較的揺れが少なく誰がやってもそれほど差はでませんが、人間の経験による知見と異なることがしばしばあります。そこが人間社会にとって便利な点で、最近は盛んに利用されるようになりました。

もう1つはAIは記憶量がものすごいのと忘れないので、知識量は増える一方で確率は高くなる一方です。人間には記憶の限界があり、適宜忘れるようになっています。その代わり世代によって受け継がれて遺産となっていきます。しかし時間がかかります。人間には歴史という知的な集積がありますが、AIは瞬時の判断なので歴史的集積を一気に取り入れて判断するという特徴があります。

AIは人間を超えるか、みたいな議論を時々見ますが、これは論理的には意味がありません。AIは人間を支援するためのシステムで競争相手ではないからです。現在のAIは人間なしに動くことができません。深層学習には必ず「教師データ」という模範データが必要で、集めたデータと模範データとの差を集積して統計的な結論をだす論理構造なので、模範データ次第で結果に差が出てきます。つまり最初からある仮説が設定されており、その仮説に従って作業していく手法を先験的手法a prioriといいます。日本ではアプリオリといいますが、英語ではアプライオライという方が多いです。それに対し、先験情報なしにデータを集積していく方法を帰納法inductive approachといいますが、完全に先験なしということは理論的にありません。データを集める段階で何らかの仮定があるからです。その偏りを是正するには莫大なデータを集めることで少し修正されます。それがAIです。結果的にAIが導き出した結論は人間の先験的仮定を崩すことも多いので、研究者にとっては便利な方法ということになります。人間はどうしても過去の経験に拘り、偏りを持ちやすいのでAIがその欠点を補っているといえます。

AI

大寒

1月20日は二十四節気の1つ大寒です。この節気が終ると春になります。今日はアホな漫才ネタを1つ。

「今日はオオサムやねえ」「アホか、ダイカンゆうんやで」
「まあどっちでもええがな。ところでオオサムは英米では秋なんやで」「嘘、いいなや」
「英語でオータムは秋のことやで。オータムコタム」「えらいこじつけや」
「ほんでもって、夏はサマーで日本は秋」「サマーのどこが秋や」
「サンマは秋の魚やろが」「なるほどなあ、って感心しとる場合やないわ」
「英語で春はスプリング」「スプリングゆうたらバネのこっちゃろ。どこが夏やねん」
「夏になったら、あちこちでプリン、プリンやろ」「あんたいつもどこ見てんねん」
「わたいプリン大好きや。デカプリン」「プリンの話はもうええわ、ほいで冬は?」
「冬はウインターや」「ウインターがなんで春なんや」
「ウインタ、ウインタで花見酒」「またえらいこじつけや」
「これでわかったやろ、季節は日本が先でアメリカが後や」「なんでや」
「日本は北半球でオーストラリアは南半球」「それは知ってる」
「南半球は季節が反対や」「そやね、日本が夏の時は南は冬」
「日本とアメリカは距離が遠い。日本は東洋でアメリカは西洋」「そうそう」
「だからアメリカの方が遅い」「なるほどなあ。ちょっと待てや」
「もうやめさせてもらうわ」

お寒いネタでございました。

四季

人間はアナログ

人間の感覚はアナログであることをきちんと理解しておくことは重要です。実は機械もほとんどがアナログです。コンピュータもデジタルなのは計算部分だけで、部品はアナログで動いています。そもそも電気はアナログなのです。コンピュータの心臓であるCPUは電気回路です。電気にはonとoffがあるので、それを1と0に割り当てて、2進法で計算させるという原理です。数字はデジタルで、普通に使う10進法の数字を2進法に変換し、その1つである1または0をbitといいます。このビットを集めて、たとえば8ビットを1つの単位と考えると、組み合わせは2の8乗つまり256通りになります。これだけあれば10個の数字とアルファベットといろいろな記号を割り当てることができます。そこでこの8 bitを1 byteバイトと設定して、数字や記号などの情報を処理するしくみです。現在GBとかMBといってるのはkキロが千、mメガが100万、gがギガで10億、tがテラで1京というように千倍になっています。ものすごい大量だということがわかります。

これはあくまでも論理と情報量の話です。ところが自然界には数字や記号のように区切ることのできないものがあります。それがアナログ情報で、むしろこちらの方が多いのが実情です。たとえば言語です。ある人が「おはよう」と言ったとして、オとハの音はつながっており、その音のつながりを聞いた人が頭の中でオとハに分離して認識しているのです。従ってその分離方法を学習していないと区切ることができません。これが外国語が聞き取れないということで、訓練することで区切ることができるようになり聞き取れるようになるわけです。

音楽も実際には音は連続していますが、譜面は音符という記号でできています。楽器を弾く人は音符に従って指定された高さの音を指定された長さで出すのですが、人により高さも長さも微妙に違いますし、そもそも高さも一定でなく揺れがあります。それが音楽の味になっているわけです。

ロボットの動きがカクンカクンとなるのは、人間の連続的な運動を記号化して区切り、その区切りに従って動かそうとするので、記号の切れ目で電気がオフとなります。ところが動かすモーターはピタっとは止れませんし、パッとは動き出せませんから、速度は山なりになり、最初はゆっくり、真ん中は速く、終わりはゆっくりにならざるをえません。そして区切りは停止します。これがアナログ情報をデジタル記号変換しアナログ運動に再変換した結果です。

それなら最初からアナログ情報でアナログ運動をさせればよさそうなものです。その技術がこれから開発されるものです。そうアナログの時代がもうじきやってきます。

アナログ

大津波の影響

思いがけぬ大津波で被災された方々には心よりお見舞い申し上げます。日本は10年前の東北大震災の記憶もあり、かなり慎重な対応でした。気象庁も想定外の事象で苦労されたことと思います。

私見ですが、この津波は悪いことばかりでなく、別の効果ももたらすであろうと思っています。今回の大津波はいわば太平洋という大たらいを揺らしたようなものですから、たらいの縁は波が大きくなり、環太平洋の湾岸の津波は想定外に大きかったといえます。もう1つの効果は海底から揺れたので、深海と浅海がかき回され、海中の模様が大きく変わったので、その影響が出てくると予想されます。まず深海の冷たい水と浅海の暖かい水が混ざったことで全体的な海水温がわずかに下がるだろうと予想されることです。これは風呂の湯をかき混ぜるのと同じで、表面の熱い湯が冷めます。

現在の気象の変化の原因は例のエルニーニョ、エルニーニャなどの温水塊が台風の源となる低気圧を発生させているのですが、それがなくなると台風の発生確率が減るかもしれません。

また海流が変わる可能性があり、漁場が変わる可能性もあり、豊漁になるか不漁になるかは予想がむずかしいのですが、海水がかき混ぜられることで水中の酸素量は増えるので、プランクトンの発生は促進されると予想され、豊漁の可能性も期待がもてます。

海水温の下降は現在問題となっている地球温暖化の速度を遅くする可能性もあります。温暖化で問題になっているのは大気の温度上昇なので、巨大な海が冷却すれば温度は一時的に下がるはずです。冷却水の温度が下がるので冷却効果は上がると予想されます。

一方、海上に浮遊するプラスチックはどこへ行くでしょうか。ハワイ沖とされているゴミの集積場は拡散されるでしょう。また海底に沈んだマイクロチップは海中に上昇してくるでしょう。魚が食べる確率は増えるかもしれませんし、一方プラスチックを食べるバクテリアの活動は盛んになるかもしれません。

これらの現象を現状のコンピュータでは計算できません。またデータが大きく変わるので今までの気候変更計算モデルでは対応できない可能性もありますから、新たなモデル構築も必要になってくるでしょう。テレビ報道では火山灰の影響、軽石の影響などネガティブな影響を強調して報道していますが、物事には必ず裏と表、良い面と悪い面があるものですから、必ずしも被害だけでなく恩恵もある、というのが私見です。

津波

視覚化

色(しき)の話の続きです。最近はビジュアルという表現の意味がかなり拡大しています。ビジュアル系バンドのように「見た目」の意味にも使われます。本来は英語のvisualという形容詞なのですが、語源は見るという意味のラテン語で、同じように派生した単語にはvisit, visonなど見るという意味から連想できる語もありますが、wise, adviseのように見る意味からは連想できない語もあります。見るという意味から「わかる」という意味にも広がっていて、英語で、わかった、いう時I see.というのはここから来ています。わかるという意味がさらに広がってwise, wizardなどもありますが、こうなるともう訳がわかりませんね。文字もvがwになったのは、vとwは元々関係が深いことがわかります。

最近流行の視覚化はvisualizationの訳語です。「見える化」という表現もあるようです。わかりにくいことでも視覚化することでわかりやすくなる、ということで、たとえば感染者数の変遷が数字だけではわかりにくいのをグラフ化することで「急激に増えた」ということが理解しやすくなります。割りあいも%の数字より円グラフの方がわかりやすいのでテレビなどではよく使われます。

意外に思われるでしょうが、これはデジタルデータのアナログ化です。今はデジタル化が至上命題のような風潮ですが、実はデジタルデータは理解が難しい場合がありアナログの方がわかりやすいことがたくさんあります。たとえば「午後1時」という時刻はデジタルですが、「2時から3時までの1時間」はアナログです。デジタルを日本語にすると計数的、アナログは計量的です。英語の時間にmanyは普通名詞、物質名詞にはmuchと習ったと思いますが、これがデジタルとアナログの概念をわかりやすく説明しています。物質名詞は単数形しかない。しかしwaterが複数形になる、つまり計数的になることをごぞんじでしょうか。There are many waters in Japan.は「日本にはたくさんの湖、池などがある」と訳されます。湖や池などの水の塊は数えることができるということです。デジタルとアナログは相補的であって、どちらかを優先するものではない、ということを理解する必要があります。人間の語感はアナログで、運動や流体もアナログです。さらにいえば自然現象もほぼアナログです。デジタルデータのメリットは計算できるということで、現代のコンピュータがデジタルデータに特化しているにすぎません。一番簡単な数学としては分数はアナログ、少数がデジタルです。3分の1というアナログデータをデジタル化すると0.33…のように近似できますが、イコールではありません。円周率もアナログデータです。アナログは古臭いと思っている人がいますし、コンピュータ社会についていけない人がアナログ人間と思われていますが、人間は元々アナログであることを知ってほしいです。

したがって流行の視覚化とはデジタルデータのアナログ化であることも理解したいです。

円グラフ

色(しき)

色と書いてシキと読むと仏教用語になります。有名な空即是色の色です。色というのは「名に見えるもの」という意味だそうです。この語句が出てくる般若心経では「無眼耳鼻舌身意、無色声香味蝕法」とあります。これらはいわゆる感覚器官と感覚です。普通は五感であり、最後の意は心でその感覚は心の対象、ということになります。ここの説明は難しいので、とりあえず除外しておいて、実際に身体がある語感について考えたいと思います。

現代で色(しき)は視覚、声は聴覚、香は嗅覚、味は味覚、触は触覚と考えられていて、仏教用語とは考え方が違います。何千年も前の思想と現代思想を単純に比べても意味がないのですが、違いが目立つのは、身は今では皮膚、心は身体の一部ではない、ということになっています。また意は脳という器官であることがわかっています。

この感覚器官と感覚には優位性があり一般にはこの順です。視覚、聴覚、嗅覚など、どの感覚がなくなると生活に一番不便ですか?と聞かれると、人により差はありますが、視覚と答える人が多いのではないでしょうか。人間は2つの目で立体視できますが、耳は2つあっても1度に1つの音しか認識できません。空間認知はかなり難しくなります。動物によりどの感覚が優位なのかは異なりますが、人間は視覚優先のようです。ただ言語は聴覚利用が圧倒的なため、コミュニケーションにおいては聴覚の占める割合は大きいです。

最近のVRは装着器具が眼鏡であることから、視覚優先の技術だといえます。イヤフォンもついている器具がありますが、イヤフォンだけのVRは見たことがありません。最先端のメタバース機材では身体に着用して触覚を刺激するタイプもあるようです。遊戯施設のVRでは視聴覚と振動などで刺激するものもあります。そうしてみると触覚の優位性は3番目なのかもしれません。実際、嗅覚と味覚を再現する通信手段はまだないと思います。もし重要な感覚であれば人間は何があっても技術開発したでしょう。テレビ番組では食レポと称する言語つまり音声による説明をしています。またインスタ映えというように画像提示をする方法も広がっています。その結果、刺激を受けた人は「おいしそう」という想像による反応を示すことになります。VRを見た人が「~そう」という表現することはまずないと思いますから、VRは実感覚に近いのだと思われます。

仏教用語の色(しき)は目に映るものなのですが、無であり空である、と説明しています。この解説は難しいので別の機会に譲ります。この五感は英語では名詞でなく動詞で表現します。It looks, it sounds, it smells, it tastesのように自動詞で表現できますが、触覚の自動詞はありません。他動詞だとsee, hear, smell, taste, touchなどで表現できます。感覚は人間共通ですが、そこにも言語と文化が関わってきます。

五感

鏡開き

1月15日は関西地方の鏡開きです。関東では1月11日のところが多いようです。元は15日までが松の内で、関西は古い伝統を守っており、関東は新しい伝統に変わったということのようです。なぜ変わったのかは諸説あります。二十日正月といい、松の内が20日に明ける地域では20日に鏡開きをします。この20日は徳川家光が4月20日に亡くなったので、月命日である20日を避けるようになったから、という説があります。そうなると元は20日が松の内明けというのが元々のしきたりだった可能性があり、現状は地域によってバラバラということのようです。重要な行事のはずですが、地域差が大きいというのもおもしろいですね。

鏡開きというのは鏡餅を割って食べる日です。刃物で切ってはいけないとされています。めでたいものなので、切るのはタブーです。カチカチの餅を手で割るか木槌で打って割ります。鏡餅がなぜめでたいものかというと、歳神様の依り代(よりしろ)で元日においでになった年神様がお座りになっておられる場所です。鏡は神社のご神体にもなっているように太陽神である天照大神の象徴で、丸い餅を鏡に見立てています。神社によっては鏡餅そのものをご神体とするところもあるそうです。鏡開きで割った餅を配り、幸運のおすそ分けをするのが本来のお年玉で、食べれば幸運が身に入ることになります。それが子供にお金を渡すようになったとはずいぶん変化したものです。

雑煮も本来はこの割った鏡餅をいろいろな具材で煮たもののことで、とくに何かを指定している訳ではありませんから、例によって「ん」が付くものを入れます。大根、人参、蓮根などです。従って鏡餅のミニ版である丸餅が本来だったでしょうが、切り餅という簡便な方法に関東では変わっていったと考えられます。鏡餅は御供えでした。

現在では鏡開きの餅はぜんざいに入れて食べる地域が多いようです。ぜんざいや汁粉の小豆は赤く魔除けの意味があります。そこに縁起のよい鏡餅を入れて食べることで無病息災が叶うということです。従って、割れた餅の欠片も全部いただきます。

かきもちにして、火鉢に網を乗せて焼いて食べるという習慣がありました。かきもちは欠き餅が語源で、割った餅のことです。これを油で揚げたりして食べることもあり、いわゆるおかきです。似たようなお菓子にせんべいがありますが、煎餅と書き中国由来です。せんべいを油で揚げた歌舞伎揚げ、ぼんち揚げがありますが、これらは商品名で戦後に開発された新しいお菓子です。

まずは鏡餅を丁寧に割って、全部いただきましょう。そして松の内が終ります。

鏡開き

知・情・意

日本語研究の先駆者の一人に本居宣長がいます。彼は知・情・意のすべてに「こころ」という読みを与えました。普通、ココロといえば心ですが、それ以外のものにもココロという読みを与えたわけです。日本文化的にはなんとなく理解できますでしょうか。

これらを英訳してみると、intelligence, affection, intensionとなり、英語のニュアンスがわかる方なら、本居の分析がいかに的確であるかがわかります。現代風に説明するならばどれも脳の作用です。

脳の作用を英語世界(たぶん西欧社会一般)ではheart and mindに分けるのが伝統です。感性と悟性という訳もあります。精神をmindの訳語にしていますが、精神にはspiritの訳語もあり、英文解釈ではよく問題になります。近年話題になるマインドコントロールはあっても、スピリットコントロールはありえませんから、訳語連結語として精神制御はmind control しかありえないことになります。マインドとスピリットの違いは別の機会にするとして、今はheartもmindも心と訳されることが多いことに着目します。ハートは心臓という臓器を示すこともあります。マインドは脳の作用であって臓器としての脳そのものはブレインbrainです。日本語はアタマなので本来は区別していません。強いていえば首と頭の区別もしていません。このように事実を現実的に区分する方法は文化によって異なっています。まして頭の中に存在する抽象的な存在の区分はかなり違っていることが想像できます。

訳語は簡単に理解するには便利ですが、誤解の元にもなります。原語と訳語の意味のギャップに気が付かないまま納得してしまうと原語を読んだ時に誤解しやすいです。ここが翻訳の問題点です。日本では昔から訳による理解が広がっています。そのため翻訳することが重要な概念輸入でした。それで訳語が発達したという長所もあるのですが、反面誤解が増えるという短所もあります。諸外国では翻訳よりも原語のまま使用することが一般的です。ところが日本では訳語文化があるため、カタカナ語による借入も次第に日本語的解釈を加えて、さらにそれらを結合して日本独自の語彙を形成する傾向があります。それがニホン英語です。意味が同じであればカタカタ英語は立派に通用します。しかし意味が違うと誤解になります。たとえばアパートはどうにか通じますがマンションは通じません。

標題の知・情・意ですが、これらをココロと読んで理解できるヤマトゴコロが残っているでしょうか。もしかすると英語などに一旦翻訳しないと理解できないほどに欧米化しているかもしれません。改めて人のココロ、自分のココロを考えてみてはどうでしょうか。精神状態などという訳語に頼らずに。今の自分の心が知・情・意のどれなのかを。

本居宣長

事実、現実、真実(VRの続編)

あなたは事実と現実と真実の違いを説明できますか?できる方は哲学に詳しい方です。日本人の多くは深く考えずにどれも「本当」として理解していると思います。曖昧なままですね。これらの単語には共通点があります。2字漢語であること、後ろが実になっていることです。何か原因があると思いませんか?そこが理解の出発点です。

まずどれも訳語です。今は日本語の中に入っていますが、元は外国語だったわけです。英語ではそれぞれをfact, reality, truthといいます。幕末から明治にかけて多くの外来語が入ってきましたが、当時は漢語の素養のある人が知識人でしたから、漢語による造語で訳語を作成しました。有名なのは福沢諭吉で、今では完全に日本語化した語彙がたくさんあります。自由、社会、会社、資本などです。訳語でも簿記がbook keepingを意訳しただけでなく音もそっくりなのは芸術的でもあります。つまり当時の文明開化は蒸気機関や鉄道などの物だけでなく、訳語を通じて概念の輸入も行われたのです。当時の日本人知識層の理解力と創造力は大したものでした。そしてそれらの訳語が中国大陸や朝鮮半島にも伝えられたので今でも音が異なって使用され続けています。それは漢字が共通であったことが関係しています。この訳語という借入方法は昔からありました。

訳語ができた当初は概念も原語のまま理解されていたのですが、使用が増えて日本語化が進むにつれて、解釈も日本文化的になり原語の意味から少しづつ離れていくようになりました。改めて原語である英語の意味を解釈してみると、事実とは人の理解とは別に物理的に存在することであり、現実とはその事実を認識することで頭の中の存在です。真実とはその認識を信じることで、抽象度が一段階上がります。真実は多数が信じれば社会的に利便性があるため事実と異なることがありえます。天動説がその典型例です。しかし日本文化では事実と真実の混同がしばしばあります。なぜそうした混同が起こるかについては、これらの訳語を大和言葉に変換してみると意味構造がわかります。真実はマコトで、現実はアリノママです。事実はコトあるいはアリなのですが、普段はあまり使いません。そして3語の共通点である「実」はマコトです。つまり「コトとしてのマコト」「アルガママのマコト」「マコトのマコト」ということで、日本文化では存在よりも信じることが重要と考えていることがわかります。その結果、西欧では事実を示して正邪を争うことになりますが、日本ではマコトかどうかで結論が決まります。解決とは「みんなが納得」という心情的な一致になります。西欧では「事実を現実と認めた人が多数」が解決法であり、いわゆるエビデンスが重要になります。日本でも最近はエビデンス主義になりつつありますが、エビデンスとは事実ではなく現実化された事実のことです。従って事実は1つであっても異なるエビデンスが存在するわけで、その証拠としての能力が争われるわけです。この日本的な解釈法はいろいろな場面で登場しますので、順次解説していきます。

福沢諭吉