鮮魚の売り方を分析する

「東京都特別区における鮮魚の品質分布と小売店の販売戦略・阪井 裕太郎 , 黒倉 壽, 多田 智輝, 野村 翼, 八木 信行」という論文がは公開された(https://www.jstage.jst.go.jp/article/suisan/advpub/0/advpub_22-00041/_article/-char/ja) 論文

管理人はこの論文の作成でデーター分析を担当した。企画とデーター収集の段階では参加していないから、単なるデータ分析屋で、論文の意図や意義全体像について語るべき立場にないが、別の意味で、面白い研究になったと密かに自負している。もともと管理人の専門は増養殖の技術的研究で、経済学や経営学の基礎的な知識はない。だから分析担当はかなり無理のある注文だが、あえてデータ分析を引き受けたのは、やってみたいことがあったからである。個人的に面白いのはここのところだ。

将棋の藤井聡太に代表される新時代の若功才能が育っている。WBCの野球を見ても、投手の球の早さや、打者のスイングスピードが従来とは違う。サッカーも新しい才能が育っているようだ。つまり、ここにきて、様々な分野で同時並行的に新しい時代が到来しているように見えるだ。これは何だろうか。管理人は人がコンピュータを使いこなせるようになってきた(本質的に言えば、各分野でデータ・サイエンスが有効に使いこなせるようになってきた。)からではないかと思っている。それによって、新しい考え方や、戦略、トレーニング方法等が出てきて、従来よりもはやい速度で世の中が変わり、新しい才能が各方面で育って来たのだろう。人の社会は経験の積み重ねによって変化していく。だから、より早くより多くのデータを集積して整理すれば、それだけ早く、新しい理論・技術・戦略が生まれ、世の中が変わる。従来は、積み重ねられた事実から、知恵やひらめきのある人がそれを理解するための法則を仮説として提唱し、それに従ってデータを整理しなおしたり、実験したりして理論が作られてきた。膨大なデーターの集積と整理はコンピュータが最も得意とする仕事だ。その速度は人間の手作業とは比較にならない。コンピュータを使ったデータ・サイエンスに習熟すれば、それだけ作業速度が上がり、理論・技術・戦略は急速に変化していくし、トレーニングの方法もより効果的で無駄のないものになっていく。実際、囲碁・将棋などでは、プロの棋士たちが、コンピュータを利用して、コンピュータが確率的計算によって出してくる結果を、従来の定石や戦法に照らし合わせて理解し、新しい定石や戦法を作っている。こうした作業を淡々とすすめて、新しい世代が成長しているらしい。その代表が藤井聡太だろう。膨大なデータの集積と整理では人間はコンピュータに勝てない。だとすれば、この部分はコンピュータに任せて、データサイエンス的に出てきた結果を自らの経験や感性を使って分析的にとらえて、理論を構築していく方が効率が良いに決まっている。

ところで、データ・サイエンスは、管理人を含めて古い世代の研究者には評判がよくない。「あんなものは研究じゃない。」「あんなものを教えても研究能力は向上しない。」と一言で否定してしまう研究者も少なくない。本心を言えば、、管理人も気分としてはこういう意見に共感できる。だからと言って同意しているわけではない。データ・サイエンスに反発する気持ちがわかるという意味である。何となく面白くないのだ。管理人が初めて研究というものに触れた大学の卒論研究の当時、コンピュータなどは手の届かない道具だったし、様々な統計資料も今のように使いやすい形では提供されていなかった。そうした中で、研究をするには、自らの経験と直観によって、データを集めて、集計用紙に記入して、試行錯誤的に頻度分布やX-Yプアロットの図を作って、個々のデータやデータ間の関係を調べて、仮説を引き出し、統計処理や実験によって、どの仮説の妥当性を検証した。当然、初心者の頃は経験が少ないから、なかなかうまくいかず、様々な試行錯誤を繰り返し、調査方法、実験手法、統計解析の方法などを身に着けていった。研究を学ぶとはこういうことだった。あまり、真面目な学生ではなかったから、基礎となる、化学・生物学・統計学・数学などの基礎的な勉強も、基礎から自分で勉強しなおしていくしかなかった。かなり苦労した。おかげで、困難なことでもめげずに、努力を続けるという根性だけは身に着いた。こういう経験があると、学ぶとは、こういう苦労を積み重ねることなのだという、錯覚が生まれる。この錯覚はかなり体に染みついている。そういう感覚があるので、涼し気な顔で、データ・サイエンス的な研究の結果を発表している学生さんを見ると。他人が作ったデータを使って、コンピューターの計算ソフトを使って、何の苦労もなく結果を出して、それを自らの努力の結果として発表している。「実にけしからん。」、「面白くない。」ということになるのである。しかし、科学研究の作業というものは、データ(事実)の集積、その結果に、理論という言葉を与えることであり、その本質は、コンピュータを使おうが使うまいが変わらない。そうだとすれば、できるだけ大量のデータを、効率よく、網羅邸に整理した方が良いに決まっている。管理人が不愉快であろうが、面白くなかろうが、若い研究者はデータ・サイエンス的手法を巧みに使っていくだろう。そのことは、科学の発達を加速させるはずだ。戦前には、実験生物学批判というのがあったそうだ。科学というのが、経験的認識で事実を集積することが科学の作業でありそれに集中していた当時の生物学者にしてみれば、実験的な手法によって簡単に、仮説の妥当性を証明しようとする新しい流れに反発があったのだろう。だが今や「実験」は生物学では当たり前の手法で、経済学や社科学でも実験的な手法が取り入れられている。これが進歩とか歴史ということなのだろう。何かの基盤になっている構造や手法が変わって、急激に変化するのである。管理人の親父は優秀なヘラ絞りの職人だった。しかし、1970年代以降はヘラ絞りそのものが過去の技術で、その技術に意味がなくなっている。親父はそれを受け入れて淡々と生きた。ヘラ絞りなどは伝統工芸ではないから、そうせざるを得ないし、それはそれでよい。管理人は、自分の次の時代がどのようなものなのか、自ら体験したいと思った。幸いなことに、魚の小売の世界については全く知識がない。予備知識や思いがないから、完全にデータ・サイエンス的に分析せざるを得ない。そこが面白い。やってみたいと思った。これが、データ分析係を引き受けた理由である。結果の解釈の妥当性については、他の共同研究者の判断におまかせするつもりだった。

こういう理由で、仕事を引きうけたので、できるだけ、分析者の恣意的判断が加わらない分析方法を選択し、そこから仮説を引き出したいと思った。そこで選んだのが、主成分分析をして、その主成分を使ってクラスター分析をして、店の販売戦略を類型化するという作業の流れである。主成分分析は、線形代数的には分散共分散行列の対角化で。分散・共分散行列は対称行列だから、絶対に、対角化できる。つまり、機械的に、データを直交空間に配置することが出来る。その上で、階層的にクラスター分析すれば、恣意的判断を加えずに、店舗を類型化できる。因子分析を使うと、因子の抽出の段階で分析者の主観が入るし、因子を斜交回転する場合にも、恣意性が入ることが避けられない。因子分析して、非階層的なクラスター分析という流れもないわけではないだろうが、管理人の研究グループへの参加動機から、主成分分析を選んだ。

共著者たちの納得も得られて、論文として発表されたのだから、データ・サイエンス的分析をしたみたいという、管理人の動機は満足させられたし、とりえず、研究としては成功したのだろう。もちろん、管理人はこれで研究として十分だとは思っていない。問題になったのは、各主成分が持つ意味をどのように解釈するかだった。各主成分に名前をつける段階で、管理人は大いに悩んだ。つまり、小売店の調査を管理人は行っていないから、それぞれに店の持っている特徴から、主成分の意味・名前の妥当性を判断するということが出来ないのである。これが、管理人の限界である。ここのところでは、実際の現場で、小売店の立地、店の雰囲気、売る場の品ぞろえ、購買層などの情報が必要だし、それを的確にとらえるには経験が必要だ。小売店の人に直接意見をきく人間関係も必要かもしれない。他の分析事例についての文献的知識や、他の踏査での経験も重要になる。これは、データ・サイエンスからは出てこない。ここの段階で、経験と感性を生かすことが、より良い研究をするために必要になる。データ・サイエンス的手法を取り入れたとしても、それは仕事の速度を速めることにはなるが、質的に向上させるためには、経験と感性が必要だ。それは、従来の研究と変わりがない。これが、このプロジェクトに参加した得た、管理人の結論である。

それはそれとして、従来の水産学では、資源状態分析法や漁獲・技術の技術的改良に関する研究が主で、水産物がどのように売られているのかという研究は少なく、その分析方法についても研究が進んでいない。広く、他分野や外国での研究までつぶさに調べれば、全くないわけではないだろうが、管理人の知る範囲(日本水産学会の論文は研究発表など)ではない。水産は水産という産業の研究なのだから、小売店などで魚がどのように扱われどの様に売られているのかを理解することは必要で、SDGsなどを考えると、資源や環境の保全と水産業の発展を両立させるためには、水産物の販売に関する研究は今後もっと必要になっていくだろう。こういう研究に、今回の分析で使った手法が生かされていけばよいと思っている。また、主成分分析からクラスター分析というパターンは、他の分野でも結構使える流れで、よくわからない時は、とりあえず、定番として、このパターンでデータを眺めてみるというのも、一つの方法だろう。

コメントを残す