キオクシア×EAGLYS:あらゆる垣根を越えた「データの共有」を促す秘密計算は未来に何をもたらすのか

2023.10.20 キオクシア×EAGLYS:あらゆる垣根を越えた「データの共有」を促す秘密計算は未来に何をもたらすのか

個人や企業のもとに眠るプライベートデータを暗号化した状態で集積・計算できるという秘密計算。同技術は「自分のデータは自分で管理する」というプライバシー(≒個人主権)に関する新たな視座、あるいは、企業間・産業間をまたいだ新たなコラボレーションをもたらすとされている。クラウド上に存在する情報に加え、個人・企業の機密情報を暗号化したまま集めて計算できる秘密計算によって、ビジネスや研究の未来はどう変わっていくのか。その可能性を探るべく、キオクシア メモリ技術研究所の吉水康人が、完全準同型暗号を用いた秘密計算の開発を進めるEAGLYS株式会社の今林広樹、丸山祐丞との鼎談に臨んだ。

完全準同型暗号とはどのような技術なのか

今林(EAGLYS):昨今、BtoBにおいてもBtoCにおいても、個人情報や企業秘密といった「機密データ」をさまざまなかたちで活用し、サービスやプロダクトの品質を向上していくことがビジネスの最前線において期待されています。例えば医療分野では、診断や個別化医療のためにAIを活用するニーズが高まっています。しかし当然のことながら、個人情報の保護やセキュリティへの対策が不完全なままでは、安心してデータを活用することができません。そうしたリスクを解決する技術として期待されているのが秘密計算です。

秘密計算とは、データを暗号化したまま計算や検索ができる技術です。従来は、データの通信時や保管時にだけ暗号化を行うことでデータを保護していたのに対し、秘密計算は、解析やAI学習などの処理中でさえ、データの暗号化を維持することで、データ漏洩や不正利用のリスクを回避することができるのです。

丸山(EAGLYS):秘密計算の方式にはいくつか種類がありますが、現在は主に、準同型暗号方式と秘密分散方式が研究開発されています。秘密分散方式はデータを意味のない断片に分けて秘匿する方式で、複数のサーバー同士を協調させ、データを秘匿したまま任意の計算を実行することができますが、複数サーバーが必要なためシステム構築の難易度が高い点やサーバー同士の結託によりデータの機密性が守れない点などのデメリットがあります。一方、準同型暗号方式は、暗号化されたデータに対して、復号せずに演算を行うことができる暗号方式で、一台のサーバーで秘密計算が可能であり、鍵さえ守ることができればデータの秘匿性を担保することができます。デメリットは、計算量があまりにも膨大になってしまうことです。現行のソリューションでは、計算量の増加を回避するために秘密分散方式と準同型暗号のハイブリッドで処理したり、SIMD計算可能な方式で演算したりと、種々の工夫をしています。しかしながら、これらの工夫によって、一部の計算が実行不可能になり、構築するシステムの構成に制約がかかるなど、不便なことも多くなります。

今林:将来的には、われわれEAGLYSが実用化を目指している完全準同型暗号(Fully Homomorphic Encryption/以下FHE)を用いた秘密計算がその課題を解決すると考えています。

FHEは、データが暗号化されたセキュアなクラウドコンピューティング環境下で、さまざまな演算をサポートすることができます。それによって、異なる組織や個人間でデータを共有したり、外部のエンティティへ計算を委託したり、データベース内の暗号化された検索クエリやデータ解析の実行をするなど、幅広いアプリケーションへの適用が可能となります。

丸山:FHEの実現に向けての課題はやはり計算量です。暗号文を操作する演算が複雑なため、計算量が非常に大きくなり、必然的に実行に時間がかかってしまいます。例えるなら、平文だと1秒で終わる処理が、暗号文の場合は約6時間かかるイメージです。そうした課題の解決に向けて行っているのが、キオクシアとの共同開発なんです。

吉水(キオクシア):具体的には昨年、秘密計算の高速化に関する共同開発契約をキオクシアとEAGLYSとの間で締結させていただきました。両社の技術を組み合わせ、ハードウェアからソフトウェアまでのレイヤーを連携させることで、秘密計算の高速化に向けた実証実験を今後行っていきたいと考えています。

社内の人間がFHEのことをシリコンバレーで耳にしたのがきっかけで、日本でがんばっているEAGLYSの存在にたどり着き、早々にコンタクトさせていただきました。「この暗号技術でデータ量が桁違いに増えるから、全てのデータが暗号化されて計算される社会が訪れたら、キオクシアのマーケットは加速度的に広がるね」と。「一方で計算量が重たくなるのが課題だね」と。

今林さん、丸山さんのおふたりと話をしたことで、FHEという技術が社会にもたらすベネフィットの可能性が見えたのと同時に、単にフラッシュメモリが売れるということではなく、技術開発の文脈でもお手伝いできることがあったので、共同開発に至りました。

丸山:吉水さんが初めてオフィスに来られた時、「キオクシアにとっては、データが大きくなることこそが魅力なんだ」といったことを言われて、「あ、そんなふうに考える人っているんだ」と素直に感動しました。「畳みたいなサイズのGPUが欲しいです」と言ったら、「そういうのを聞きたかった!燃える」と常識では考えられないことを真剣にどうやって作るかディスカッションしてくれたり、普段付き合いのあるビジネスの人たちとは感覚が違うな、という印象がとにかく強かったです。

新しいコンピューターを作りたい

吉水:「畳サイズのGPUを作ってほしい」というのは、あながち笑い話ではありません。EAGLYSが求めているような計算機を実現するにあたって、SSDやフラッシュメモリといった、現在キオクシアが持つコアプロダクトの技術を生かせる部分は正直多くないんです。周辺にある技術をいろいろ育てながら進めていかないと、おそらく届かない。つまり、ぼくらとしても新しい領域への挑戦なんです。

今林:ぼくらが開発しようと思っているのは、一般的なコンピューターのような汎用性が高いものではなく、特定のデータの処理に特化したコンピューターです。それこそ、平文を扱うのに最適なコンピューターと、暗号文を扱うのに最適なコンピューターは異なります。何しろ、例えば平文だったら1ビットを送ればいいところ、暗号文の場合は4000*32ビットを一気に送らないといけません。その点だけをとっても、回路の最適解はまったく異なります。

現在のコンピューターは汎用的なデータ処理を前提に設計されていますが、ぼくらが作ろうとしているのは、例えばゲノムの分析といったタスクを、よりセキュアなパイプライン──それこそストレージからコンピューティングまで──として一貫した、「これ1台あれば大丈夫」といったコンピューターなんです。そうした環境が、実は世の中的にも求められ始めています。

いまだと、いろいろなクラウドサービスが提供されていますが、そういうところに自分のゲノムデータとか、もっと言うと企業の機密情報を上げたいかというと、当然、上げたくないですよね。その一方で、企業間のデータ連携が進むことで、例えばサプライチェーンの最適化とか、さまざまなメリットが発生することが指摘されています。でも、現状ではさまざまな企業のデータを「ひとつの箱」に入れ込みたいと思える環境がない。

いろいろなデータを混ぜ合わせて解析することで、一社や一個人で完結するデータでは見えてこなかったおもしろい世界を作ろうよ、という時に必要になってくるコンピューターを設計しているんです。

丸山:従来のコンピューター・アーキテクチャでは、プライバシー保護は信頼の上に成り立っているものが多いです。大企業だから情報を渡しても大丈夫だろうとか、取引実績があるからまあ大丈夫だろうとか。でも、信頼関係を構築するのは結構大変で時間がかかります。ましてや本当に重要な情報、例えば漏洩したら会社が倒産するような情報を信頼関係だけを頼りに活用するのは、リスクがあり過ぎる。それに対して、ソフトウェアとハードウェアを一貫して開発することで、信頼関係によらない仕組みとしてプライバシー保護を実現していこうとしているところです。

吉水:キオクシアのストレージ技術には、データ活用という大きなトレンドに対応できる強みがあります。ただしその大きなトレンドにおいて重要なのは、SSDやフラッシュメモリの売上げだけでなく、「データそのものが価値を生み出す」という側面を的確に捉えることです。ChatGPTのような生成AIに無限のデータを学習させて巨大な言語モデルを作ることはできます。しかし、そのためには膨大な量のデータを高速に処理できるストレージとコンピューティングが必要ですよね。それと同じことです。EAGLYSが手がけるこの分野はまだ参入企業が少なく、キオクシアの強みも発揮できます。いまなら、一緒にビジネスチャンスを掴むことができるはずです。

社会実装に向けたボトルネックとは?

今林:この領域、特にFHEはグローバルで非常に注目されており、IBM、Microsoft、Googleをはじめとするビッグテックの研究投資が加速してきています。米国国防総省も民間に投資をしているほどです。その成果物としてオープンソースの開発は進んでいるのですが、一方で、実際の活用事例までたどり着けていないようです。ユースケースを謳っていても、仮説にとどまっているものがほとんどで、彼らもユースケースを作ってくれる企業を待っているようにも見えます。それもあり、今後の社会基盤を作っていくポテンシャルとトレンドがあるのに、わかりにくくて注目されにくい領域だったりしています。ビットコインがあってブロックチェーンへの注目・期待が一般にも集まったように、秘密計算・FHEにもそういった応用先が必要不可欠です。

吉水:しかし、まったく注目されていないわけでもなく、例えば内閣府の有識者会議において、EAGLYSも視野に入れている「マテリアルズ・インフォマティクス」の分野で、秘密計算をもっと活用していこうといった文言が出てきていましたよね。

今林:もちろん、投資をする側にしてみたら「ROI(投資収益率)はどれくらいなの?」といった点は気になることだと思うので、ぼくらとしては、「計算機、できました!」といってコンピューターとライブラリを置いておしまいではなく、常にアプリケーションレイヤーというかユースケースからリーチしていくことで、業務への活用イメージや業界に普及したときの変革イメージをもってもらいやすくする活動が重要だと思っています。

丸山:その通り。キオクシアのように「将来、どんなおもしろいことができるのか……」みたいな観点からさまざまな産業の人たちがつながって、そのコンソーシアム的なものに予算が付いていくような流れが加速するといいなと思っています。それで言うと、ぼくはひとついいアイデアを持っています。「盗聴アプリ」というのですが……。

吉水:なんて最悪なネーミング、と思いましたよ、最初は(笑)。

丸山:いや、そうなのですが、秘密計算がもたらす新しい世界を伝えるのに非常にわかりやすいと思っているので、仮称で付けています(笑)。具体的には、スマホで録音されていたとしても世界の誰であっても、自分自身ですら、音声を聞くことができないけれども、解析ができて、解析結果の閲覧はできるというものです。

現在も、スマートフォンやスマートウォッチ経由で脈拍とか睡眠時間といったライフログをとって健康に活用しようという流れがあると思いますが、自分の健康状態をより正確に知るためには、もっと多様なデータ収集が必要だと思うのです。例えば、人の声も、どのような内容を喋っているかを分析すれば認知症やアルツハイマーの早期発見など、メディカル面で重要な指標になるとされています。

しかし実際のところ、普段の生活の音声を録音するといった、継続的なデータ収集はなされていません。24時間、自分の発言や自分に喋りかけてくる人の発言が記録され、それをどこかの誰かが解析するなんて、プライバシーの侵害も甚だしいですからね。でもFHEの技術があれば、音声データは暗号化され誰も中身がわからない状態で、誰も元に戻せない状態にして解析することができます。解析結果のみを元に、専門医と、もしかしたら医療AIによっていろいろな症状が早期に発見されるかもしれません。

誰も絶対に開けられない状態、数学的に開けられない状態だけれど、解析することができる。そして解析結果だけを閲覧することもできる……このような仕組みが使われているのなら、自分のスマホに盗聴器が入れられるって、気にすることありますか?前向きに他人に盗聴器を仕込んでもらいたいってぼくは思うのです。プライバシーが絶対に保護されるけど自分の情報はどんどん記録されて、自分の利益のためだけに使ってくれる仕組みの上で動くアプリをスマホ経由で使ってもらえると、データ収集がさらに加速し、いろいろなものが分析できるんじゃないかなと思っています。

今林:いいアイデアだし、今後実現可能かもしれないけど、名前は変えたほうがいいよ(笑)。そういった意味では、スマホもある種、現代の盗聴器。GPSがあって人類の移動も豊かになったわけだし、それが生活にもヘルスケアにも取得範囲が広がるイメージですよね。そう考えると、“盗聴”も良い言葉に聞こえてくる(笑)。

「データの連携」がもたらす未来

今林:さまざまなインダストリー(業界・産業)が内部に抱えている、もしくはそこに眠っているビッグデータこそが、今後の社会変革や個人のウェルビーイングにもつながるトリガーであることは間違いないと思っています。

なかでもメディカル・ビッグデータは、その価値がもっとも伝わりやすい領域であることは間違いありません。コロナ禍によって例えばリモートワークが増えたことで、生活習慣病や精神疾患的な症状などを訴える人が増えているようですが、生活習慣病の場合、専門医が診るケースは少なく、あとは手が空いた時間に非専門医が診察にあたるため、間違った診断を下すケースが増えていると言われています。

そうした課題に対して、AIによるサポートはソリューションのひとつになり得ますが、データを集めないことにはAIによる正確な判断は望めません。しかし現状は、医療機関の外に個人データを持ち出すなんて御法度中の御法度ですし、ましてや各医療機関のデータをマージしていくことなんて、まだまだ現実的ではありません。

でも、ストレージからコンピューティングまでが一貫しているFHEがあれば、データを隠した状態、つまり暗号状態のままAIが解析し、その結果をみんなで享受することが可能になります。そうすると、間違った診断を下す可能性が減るだけではなく、製薬会社とデータを共有することで創薬につながったり、さらに極限までいくと、パーソナライズド・メディシン(個別化医療)に近いところまでが可能になるインフラを整えていけるかもしれません。

吉水:メディカルヘルスケアの領域は、現在の課題解決も含めて、とてもイメージしやすいケースですよね。パーソナルデータと診断データ。その組み合わせの解析結果からは、計り知れないバリューがたくさん生まれると思います。

遺伝子解析による難病の原因究明みたいなケースでも、例えば、個人の承認をもらって500件のゲノムデータを集めることはできるかもしれませんが、1億人分を集めることは現実的に不可能です。

データが少ないと、「成人病になりやすい/なりにくい」ぐらいしかわからないけれど、1億人分のデータがあれば、もしかするととても稀有な難病の原因究明もできるかもしれない。でも、現状では物理的にデータを集めることができない……といった課題があったとき、FHEは、そこに斬り込んでいくことができるというわけです。

今林:生の情報というかオリジナルな情報──いわゆる一次情報──は、当然取得するのに時間的にも金銭的にもコストがかかるわけですが、FHEを活用することで、そうしたコストを一気に省くことができるだけではなく、いままで見えてこなかった深度でデータを利活用することができるようになるんです。ChatGPTみたいな生成AIは、Googleに載っているようなオープンなデータ、つまり二次情報、三次情報を元に育っているわけですが、そうしたものをありがたがっている世の中に対し、いち早く一次情報を有効活用できた個人や産業が、生き残っていくのではないかと思います。

丸山:メディカルヘルスケアの領域で一次情報を活用していくのはもう少し先になりますが、EAGLYSではすでに、化学メーカーや素材メーカーに対して、いまお話したようなサービスの提供を始めています。

例えば、現在提供を始めている「ALCHEMISTA」というサービスは、化学メーカーに対して自社の素材データを暗号化して外部に公開できる機能を提供し、素材メーカーに対しては、製品メーカーの試験結果データなどを暗号化して素材メーカーに提供できる機能を提供しています。

化学メーカーや素材メーカーは、自社の素材の価値をアピールできるとともに、新たなビジネスチャンスの創出、外部の企業や研究機関とのより詳細なコラボレーションや共同開発などが可能になります。その一方で外部の企業や研究機関は、自社のニーズに合った最適な素材などを見つけやすくなります。つまり、自社データの秘匿性を保ちながら、最適な素材や最新のニーズを選択しやすくなるのです。

吉水:おふたりと一緒にやっていて思うのは、新しいアイデアがどんどん湧いてくる楽しさです。ベースで考えていたことはあるのですが、それを実現するアイデアがどんどん積み重なって、勢いを増していく感覚というのは、普段なかなか味わえるものではありません。

2社の共同開発で進めてきた「第一段階のハードウェアとソフトウェア」が、2023年内にいったん形になります。真の意味でのFHEというか、非常にハイレベルなプラットフォームになる予定です。それを、おそらく世界に先んじてお届けできると思います。

先ほど今林さんからもあったとおり、「コンピューターとライブラリを置いておしまい」ではなく、ユースケースをつくって社会に発信していくことが大切だと考えています。その意味でも、丸山さんが挙げられた化学業界におけるマテリアルズ・インフォマティクスの領域でまずは成果を挙げ、その後はメディカル領域に挑んでいきたいと思っています。

今林:記憶とその活用は両社にとってシナジーの高い共通のキャンバスですね。そこに、キオクシアの夢とEAGLYSの夢、お互いの絵をまぜあわせ重ねていくのはとてもエキサイティングな共創活動です。EAGLYSだけでは描けない先の未来も、技術革新で乗り越えられそうです。

その意味でも、引き続きキオクシアにお力添えいただけると本当に心強く、またこの協業を通して新たな未来を築いていけると確信しています。

掲載している内容とプロフィールは取材当時のものです(2023年7月)