ナウキャスト×機械学習~「機械学習エンジニアはフルスタックになっていく」ってどういうこと!?~

株式会社ナウキャスト 片山 燎平 機械学習エンジニアのやりがいとアドバイス

AI の活用と AI 人材の活躍を分かりやすく紹介するこのシリーズ。

第二弾の今回は、株式会社ナウキャストの片山 燎平様に ZOOM にてお話しを伺いました!

目次

ナウキャストのビジネスモデルは?

株式会社ナウキャスト 片山 燎平 ビジネスモデル

ーー本日はご協力いただきありがとうございます!まずは、御社のビジネスモデルをご説明いただけますでしょうか?

ナウキャストは、金融、マクロ、コーポレートの3つの領域でビジネスを展開していますが、僕は主に金融領域を担当しています。金融領域のビジネスモデルを簡単に説明しますと、データを所有しているパートナー企業(日系大企業がメイン)からお預りしたビッグデータを分析しやすい形に加工し、海外のヘッジファンドに提供しています。

この事業の背景として、まず日本国内のデータ収益化へのニーズが挙げられます。

2、3年前の AI ブーム以降、日本の大企業には「自分たちが所有しているビッグデータを収益につなげたい」というニーズが根強くあります。具体的には、スーパーなどが持つPOS(Point Of Sales) データや、JCBなどクレジット会社が持つカード決済のデータなどですね。

一方で、海外には「日本のビッグデータを活用したい」というニーズがあります。

近年、オルタナティブデータをAIで分析して投資判断に反映させるヘッジファンドが登場し、アメリカ市場の投資で好成績を上げています。日本の株式市場は世界で3番目に大きく(時価総額基準、2020/8/12現在)、ヘッジファンドは「次は日本でも AI ドリブンの投資を行いたい」と考えています。

ただ、日本では海外ほどデータの流通が進んでいないことに加えて言語の障壁もあり、ヘッジファンドの社員自ら日本企業に営業をして回るのは、とても効率が悪い。「すぐに分析に使える日本のビッグデータ」を買った方が早いわけで、そこに弊社へのニーズがあります。

ーーありがとうございます。御社がファンドとして AI ドリブンの投資を行うという選択肢もあったかと思いますが、現在の事業モデルを選んだのは何故でしょうか?

現在の事業モデルは、弊社のビジョンから来るところが大きいですね。

弊社は「高精度の物価指数を高頻度で提供する」ことを目的とした「東大日次物価指数プロジェクト」からスタートしています。このスタート時のモチベーションが「データを届けて、活用してもらうことで、社会の意思決定をより良くしたい」という思いでした。この思いは今でも変わらず、「データを使って僕らがお金儲けをするよりも、データの価値を色んな人に届けたい」というのが、現在の事業モデルの根底にあります。

ナウキャストは機械学習をどのように活用しているの?

株式会社ナウキャスト 片山 燎平 機械学習の活用

ーー次に、機械学習が御社の事業でどのように活用されているのか、お聞かせいただきたいです。

結論から申しますと、現在のフェーズでは機械学習をメインで活用しておりません。

背景をお伝えしますと、事業を開始した当初はお客様からのニーズもあったため、機械学習を活用していました。例えば、上場企業の売上をPOSデータから予測するモデルを作ったり、海外のヘッジファンドの投資行動を米国の財務データから予測するモデルを作ったりしていました。しかし、想定したよりも売上につながらなかったのです。理由はいくつかあるのですが、一番の理由は「機械学習がブラックボックスであること」だと考えています。例えば、金融や投資の世界では意思決定に説明責任が求められるため、いきなりPOSデータを持ってきて「機械学習を使えば80%の精度で売上が予測できます!」みたいに営業されても、顧客は継続的に大金を払う気にはなかなかなりません。

そこで、現在は戦略をピボットし、データそのものの価値をお客様に提供するためのプラットフォームの開発に注力しています。POSデータを例に挙げると、企業の売上予想までしなくても、各企業の売上動向をアイテムレベルで“ナウキャスティング”できれば、それだけで価値になります。まずはお客様のデータ利活用を実現し、僕ら自身もお客様のニーズとデータの両方を今以上に深く理解してから、あらためて機械学習を活用した新しい付加価値の創出に取り組めればと思っています。

ーーつまり、機械学習は、サービスの付加価値として今後活用していくということでしょうか?

はい。個人的には、機械学習というのはスパイスのようなものだと思います。機械学習は、お客様への提供価値を80から90に上げることは非常に得意なのですが、0から50にしなければいけないという段階から機械学習をゴリゴリ使っていくような事業は極めて稀です。

例えば、機械学習の活用事例として「スーパーでの消費行動に天気が与える影響の可視化」が考えられます。ある時期にある銘柄のアイスが大量に売れたら、投資家はその銘柄に注目しますよね?でも、「たまたま6月の気温が高かったからアイスが売れた」のか「その銘柄の商品企画や販売戦略が上手かったから売れた」のかによって、投資の意思決定は大きく変わってきます。もし、機械学習などの統計的なモデルを使って定量的に気温の影響を取り除くことができれば、それがお客様にとって大きな価値となります。

ただ、機械学習を活用した弊社独自のインサイトの価値をお客様と共有するためには、まず「この銘柄のアイスが売れていた」という情報に注目いただき、実際の数値を見ていただき、「確かにアイスは売れているがこれは天気の影響ではないか?」という疑問をお客様自身に感じていただく必要があります。その上で「弊社の機械学習モデルを使うと、天気の影響を差し引いてもこの銘柄のアイスが売れていることがわかります」と説明することで初めて価値提供が達成されます。

ですので、まずはお客様にデータ活用をしていただくための基本的な土台を固めた上で、スパイスとして機械学習などの統計的なモデルを提供する、という順番で事業を進めていきたいと考えています。

ナウキャストの機械学習エンジニア

株式会社ナウキャスト 片山 燎平 機械学習エンジニア

機械学習エンジニアの体制と経歴は?

ーー機械学習領域のスキルを持つエンジニアは何名ほどいらっしゃいますか?

現状、機械学習に関連するエンジニアは5名です。

うち1人は僕で、今まで機械学習系のプロジェクトを複数担当していたのと、出身学部が CS (コンピューターサイエンス)で統計周辺の基礎知識はわかるので、機械学習エンジニアを名乗っても差し支えないかと思います。2人目は東大の情報系の院に在籍していて、そこで自然言語処理の研究をしながら弊社でも働いています。彼も僕と同じように機械学習プロジェクトを複数経験しています。最後の1人は東大の理学部物理学科を卒業しており、機械学習の土台となる数理知識への理解の深さは日本でもトップクラスです。彼は機械学習プロジェクトの実務経験はまだ無いのですが、Kaggle などのデータ分析系のコンペで高い成績を残しています。
ほかの2名は機械学習プロジェクトの経験は無いものの、それぞれ前職や学生時代に機械学習に関連するスキルを身につけています。

機械学習エンジニアの業務内容は?

ーー御社のエンジニアは、現在、どのような業務を行っておりますでしょうか?

現在の業務内容は、データエンジニアやデータアナリストに近いですね。

まず、データエンジニアはデータパイプラインの構築と運用が主な任務です。データパイプラインとは、パートナー企業からお預かりした生データをお客様が使える状態に加工するまでの一連のプロセスを指します。例えば、POSの生データでは、そのトランザクションがどの上場企業のデータかという紐づけがされていませんが、投資分析を行うためには上場企業との紐付けは必須です。このように、データ分析に必要な加工プロセスを定義して、ミスなく加工するのがデータエンジニアの仕事です。

一方で、データアナリストは、お客様にとって価値のあるインサイトを抽出するために、分析やデータの整備を行う仕事になります。また、お客様と株のアナリストとデータエンジニアの橋渡しをしていることも多いですね。「お客様のニーズは○○で、株のアナリストは△△と言っているから、データエンジニアにはこういうデータを用意してもらおう」というふうに、データの整備、分析基盤の構築、分析の実施、社内外のステークホルダーとのコミュニケーションなど、様々なことをマルチにこなしながらデータからインサイトを見つけるのがデータアナリストの醍醐味です。

機械学習エンジニアの必須スキルは?

ーーこれらの業務を行うために必須のスキルは何でしょうか?

まず、ナウキャストのデータエンジニアに求める必須スキルは、Pythonの実務経験、データパイプラインの構築経験、データベース開発経験の三つです。特に、データパイプラインの構築はメジャーな開発ではないので、構築経験を通じてデータパイプライン特有のツボがわかっているかは重要です。これらに加えてAWSなどのクラウドサービスの知識や実務経験があると、より望ましいです。

ーーデータと言えば「数学」を連想する方も多いと思うのですが、「数学力」は必須でしょうか?

データエンジニアの業務に「数学力」はマストではありません。

データアナリストの場合も数学ができるに越したことはないですが、「このデータからはこういうインサイトが導き出せるのではないか?」ということに気づいて、実際に可視化して説明できることの方が重要です。そう言った意味で、データとお客様のニーズを理解する能力の方が重要と言えます。

一方で、機械学習エンジニアには数学力は必須です。具体的には、理系大学の学部レベルの微積/線形代数/統計学の知識はあった方が良いのではと思います。最近はライブラリが充実していて、モデルを動かすだけなら割と簡単にできますが、データの前処理、モデルのチューニング、結果の評価を行う際にモデルの仕組みを理解していることは重要です。モデルをきちんと理解するためには、先述した数学や統計学のスキルが必要になります。

ーー機械学習エンジニアを採用する際に重視しているポイントは何でしょうか?

プロダクトへのモチベーションですね。弊社はベンチャーなので、プロダクトを作って、お客様に価値を提供して、最終的にお金も稼ぐことが求められます。その過程で、泥臭いことや周辺領域のことなど、分析以外の業務をやらなければならないシーンが必ず出てきます。「機械学習を使って良いプロダクトを作りたい」「お客様を喜ばせたい」という気持ちが強い人は、機械学習以外の周辺業務も自然にできるような気がします。なので、そこのモチベーションは重視してますね。

機械学習エンジニアのキャリアプランは?

ーーここまでは、御社の機械学習エンジニアの現在の業務内容や必須スキルを伺ってきましたが、御社の機械学習エンジニアの皆様はどのようにキャリアップを考えておられるのでしょうか?

弊社の機械学習エンジニアは、フルスタックエンジニアを志向する人が多いです。これは、機械学習エンジニア業界全体で見られる傾向だと思います。

機械学習エンジニアのミッションは、機械学習を用いて社会に価値を提供することです。そのためには、機械学習モデルへの深い理解のみならず、モデルの精度を上げるためのデータ前処理の知識や学習のPDCAを効率良く回すためのパイプライン構築など、様々な周辺領域の知見が必要になってきます。「前処理1→前処理2→前処理3→モデルの学習→評価→運用」のようなパイプラインをキレイに実装するのは、完全にエンジニアリングの世界です。単なる機械学習モデルの理解を超えて「機械学習で社会に価値を提供する工程」の上流や下流に視野が広がっていくと、「分析に必要なデータを取得するためのデータベースを設計しよう」とか「機械学習で作成したモデルを実際のサービスにつなげるためにAPIで発信しよう」というモチベーションが自然と湧いてきて、結果的にフルスタック志向になっていく人が多いのではないでしょうか。

機械学習エンジニアを目指した動機は?これから目指す人へのアドバイス

株式会社ナウキャスト 片山 燎平

ーー片山様が今の職種を選ばれた経緯を教えて下さい。

僕がデータ分析系の仕事を選んだ理由は二つです。

一つは、シンプルにデータ分析が好きだったからです。データという無機質なものに対して色々なアプローチをかけていくと、それがあるタイミングで急に人の役に立つインサイトになる。分析して、分析して、分析して、分析して、ポンっと発見につながった時に感じる、「無機質なデータと人間世界をちゃんとつなげた!」みたいなスッキリ感が好きですね。

もう一つは、「社会に対して価値が提供され切っていない新しい技術」を使ってプロダクトを作ることに僕のモチベーションがあるからですね。僕がナウキャストに参画した当時、まだ使われ切っていない新しい技術で、なおかつ可能性が大きいと感じたのは「ビッグデータ」でした。IoTが発達してロボットの普及が進んだら集まるデータは膨大な量になるはずで、今後もフロンティアが存在し続ける領域だと考えました。だったら自分の専門性の一つとしてデータ分析を身に着けたい、と思ったのが二つ目の理由です。

ーーありがとうございます!最後に、これから機械学習エンジニアを目指す人へのアドバイスをお願いします。

働き甲斐は、とても重要だと思っています。

人にもよるとは思いますが、僕にとっては「データを使って人の役に立つインサイトを見出すこと」が働き甲斐です。目の前の事象に対して何かしらの仮説を持ち、仮説に基づいてデータの整形とモデルの選定を行い、実際に学習させてみて、仮説通りに結果が出たときはとても気持ちが良いです。雑多なデータから自分なりの仮説と機械学習の諸々の技術を用いてインサイトが得られる快感は、大きな働き甲斐になっています。

スキルの話をすると、基本的に機械学習に特化しすぎない方が良いと考えています。キャリアの話の中でも説明しましたが、情報系のPh.Dを卒業して専門の研究機関でキャリアを積んでいくレベルでないと、機械学習のスキルだけでキャリアを生きていくというのはかなり厳しいです。ですので、「機械学習しかできません。モデリング大好きです」みたいなキャリアはあまりお勧めできません。それよりも、機械学習などの統計のモデルをお客様の価値につなげるために周辺領域のスキルも習得していくのが、機械学習エンジニアの95%にとっての勝ち筋だと考えております。

株式会社ナウキャスト 片山 燎平 機械学習エンジニアのやりがいとアドバイス

機械学習はスパイス。その真価を発揮するために、現在は土台となるサービス作りに注力しています。

片山様のお話を聞いて、機械学習に限らず、技術は社会に価値を提供する手段であり、技術を使うことそのものを目的にしてはいけないことを改めて痛感しました。
一方で、機械学習エンジニアとしての働き甲斐をイキイキとお話しする片山様を見て、仕事を楽しむための内発的な動機を持っていることは大きな強みになると感じました。
機械学習で社会にどんな価値を提供したいか?
自分は機械学習のどんな部分を楽しいと感じているのか?
これから機械学習エンジニアを目指す方は、この二つを明確にしておくと良いのではないでしょうか?
片山様、ありがとうございました!

よかったらシェアしてね!
目次
閉じる