KAKEHASHI Tech Blog

カケハシのEngineer Teamによるブログです。

カケハシ データ組織 2025年の振り返り

こちらの記事はカケハシ Advent Calendar 2025 の 23日目の記事です。

こんにちは。Data, AI領域でHead of Engineeringをしている鳥越です。

「師匠も走る師走」という言葉通り、私も最終営業日までバタバタと走り回る予感がしています。ただ、年末の最重要ミッションの一つとして、🎅さんにSwitch2のお願いをしており、在庫不足で大丈夫かな、、、と不安だったのですが、先ほど仕入れられたと連絡がきまして、ひとまずホッとしているところです。小学生の息子も喜ぶと思います。

さて、今日は一旦立ち止まって、私の組織の2025年を振り返っていきたいと思います。また私事ですが、入社から1年以上が経過し、医療業界におけるデータ活用の「難しさ」や「面白さ」の解像度が上がってきました。せっかくの機会ですので、組織の振り返りと合わせて、まとめてみたいと思います。

医療×データの難しさと面白さ

私たちは Company Deck に掲げている「難しい、でも誰かがやらなきゃいけない、医療という社会課題の解決。」に向けて、薬局DXを入り口とした日本の医療システムの再構築を目指しています。

具体的には「調剤薬局DX」「患者向けプラットフォーム構築」「医薬品流通の最適化支援」という3つのアプローチで事業を展開していますが、これらを支えるデータ戦略もまた重要です。「どのようなデータを獲得し、どう整備し、どう活用(AI/分析)していくのか」という階層構造を描き、事業戦略と密に連携させています。

こうした大きな戦略の中で、eコマースやFintechといった業界を経てカケハシに入社した私が感じたのは、医療業界特有の「難しさ」と「面白さ」です。なぜ医療データは一筋縄ではいかないのか、そして何がそこまで面白いのか。その実態を整理してみます。

難しさ

1. 取扱いの安心安全が絶対条件

医療業界では、個人情報の中でも特にセンシティブな「要配慮個人情報」(問診結果や薬歴など、臨床・医療そのものに関わる情報)を取り扱います。これらを再現性高く、安心安全に取り扱うためには、一般的な法規制への対応に加え、「医療情報システムの安全管理に関するガイドライン」等の業界規制や利用規約を遵守する体制や基盤整備が Must Have です。

テック業界では近年、データスチュワード、データマネジメント、アナリティクスエンジニアなど、データ活用のための役割細分化が進んでいます。一方、医療業界には以前よりCRO(医薬品開発業務受託機関)のように、治験データの品質と信頼性を担保する専門機関が存在しており、データマネジメントという文脈において、元々高い品質意識や分業体制が根付いています。 既存の取り組みへのリスペクトと理解を持った上で、そこにテック業界のプラクティスをどう融合させていくか。ここが重要なポイントだと考えています。

2. 科学的アプローチの重要性

データの分析 (と一部の整備) においては、再現性が高く、かつ説明性や客観性を確保した「科学的なアプローチ」が必須となります。これはデータ自体のセンシティブさに加え、人の健康に関わるというミッションクリティカルな特性に起因します。

特定の希少疾患などを扱う場合はサンプル数が限られますし、属性や環境など様々なバイアスも存在します。また、プライバシー保護の観点から、数学的な匿名化モデルに近接した議論が必要になることもあります。これらに対し、ABテストなどテック業界の組織的ベストプラクティスを理解しつつ、医療特有の要件とうまく融合させていく必要があります。

面白さ

1. データ基盤構築やマネジメントが事業の「Must Have」であること

私の経験上、一般的なWebサービスにおいてデータマネジメントは「Nice to have」寄りの価値観で進められることが多く、その重要性が理解されにくい側面があると考えています。 しかし医療においては、前述の特性上、適切なデータマネジメントは事業存続の条件、すなわち Must Have です。事業レイヤーにおいても、データの取り扱いや目的適合性が議論になることは多々あります。「ここまで真剣にデータマネジメントに向き合っている業界は他にないのでは?」と感じるほどです。

また業界全体としても、マイナンバーを起点にしたオンライン資格確認や、次世代医療基盤法医療デジタルデータのAI研究開発等への利活用に係るガイドラインなど、データを医療へ活かすための議論が進んでいます。データを医療へ還元する機運が高まっている点も、面白いフェーズだと感じます。

2. 新たなユースケースを生み出せる

私は10年以上、データ活用に積極的な金融やインターネット業界に身を置いてきましたが、それらの業界では財務的に大きな影響を与えるため重要領域ではあるものの、ある程度定義された課題(Well-defined)に対して地道な改善を繰り返す場合も多いのではないでしょうか。

対して医療DX、特に基幹業務に関わる領域はまだ始まったばかりです。 アナログな情報やデータ化されていない情報を構造的に扱えるようにし、適切にデータマネジメントを行い、最後に分析やAI活用へつなげる。成熟した技術と最新技術を使いこなし、効果とコストのバランスを見極めながら領域を開拓していく——。 時には未知の課題にぶつかり悩むこともありますが、それ以上に難しい課題を解く面白さが勝る感覚があり、これこそが医療業界の醍醐味だと感じています。

(余談ですが、昨今はデジタル庁をはじめ、スタートアップでも成熟産業に挑戦する動きが増えていると感じます。そうした業界で取り組む友人と話すと、抽象化すれば類似した課題を抱えており、これからの社会で求められる貴重な経験ができているようにも感じます。)

2025年の振り返り

そうしたやりがいを感じながら駆け抜けた2025年でした。前置きが長くなりましたが、ここから今年の組織の動きを振り返っていきます。

組織体制について

私の組織は、下図のData & AI Domain内の4チームに加え、年後半からはPlatform Domainの DRE (Data Reliability Engineering) チームとも密接に連携して動くことになりました。本記事ではこれら5チームと、それを取り巻く全社的な動きを振り返ります。

サプライチェーンマネジメント領域

「医薬品流通の最適化支援」に貢献するチームとして、弊社が提供する薬局向け医薬品在庫管理アプリ「AI在庫管理」の需要予測機能開発や周辺企画を行っています。

プロダクト運用開始から数年が経ち、今年はフェーズに合わせた難易度の高い課題に取り組みました。9月のブログ記事でも触れた「精度向上と運用コスト最適化」を狙ったモデルの大規模な見直しに加え、アプリ利用率向上のための機能改善、医薬品供給不足問題の解消に向けたリアル需給データの可視化などに取り組み、一定の成果を出せたと思います。

エンゲージメント領域

ここで言う「エンゲージメント」とは、患者さんの医療に対するエンゲージメントを指しています。患者さん中心の医療については、先日のアドベントカレンダーで弊社の中江がとても良い記事を書いていますので、ぜひ併せてご覧ください。

この領域はまだ発展途上ですが、上記記事内の紹介サイトにもあるLINE配信設計や効果検証、そしてその土台となるデータ基盤整備(弊社 川邊の記事)に着手しました。来年以降の本格化に向けた、良い仕込みができたと感じています。

生成AI研究開発領域

生成AIを活用した既存プロダクトのエンハンスメントを推進しました。 今年は機能リリースに向けた動きを活発化させ、10月のAWS Industry Summitでの登壇や、11月の日本薬局学会 学術総会(Npha)での新機能プロトタイプ提案を行いました。様々なフィードバックを頂けたほか、実運用の知見も蓄積されてきています。これらを活かし、AI技術による薬局業界のトータルサポートに向けて、走り出し始められたと考えています。

企画室

今年はカケハシとして初めて、3月の言語処理学会(NLP)および5月の人工知能学会(JSAI)に協賛しました。JSAIでは1件ですがポスターセッションにて発表も行いました。業界貢献のため、来年も積極的に発表していく予定です。

また年後半からは、社内の医療研究推進者(工藤)がチームにジョインし、医療研究の社会実装に向けた議論を開始しました。具体的には、医療品質を客観的に評価する指標「クオリティ・インディケーター(QI)」のより深い検討を進めていければと考えています。まさに医療の本丸 × ITという、ワクワクする領域です。

Data Reliability Engineering (DRE)

前述の通り、私たちの領域においてデータ基盤構築は Must Have です。取り組んでいるテーマは多岐にわたりますが、一つピックアップするとすれば「これまでのデータメッシュの振り返りと、現状組織への最適化」です。過去のデータメッシュの記事はこちらを参照ください。

ご存知の通り、データメッシュとは、ドメインごとにデータのオーナーシップを持たせる分散管理の考え方です(恥ずかしながら、私は入社までこの言葉を知りませんでした)が、ここまでの実践の結果、以下の課題が見えてきており、それに対する方針策定や対応を行なっておりました。

1. データ利用が十分なドメインではワークするが、そうでない領域では難しい

当たり前の話ではありますが、データ利用があってこそのデータ基盤構築です。Data Mesh Principles にも、

Data mesh objective is to create a foundation for getting value from analytical data and historical facts at scale...

とあるように、これはスケールが必要 = データ利用の必要性がある程度見えていて、スケールさせていきたいタイミングで効力を発揮する考え方だと解釈しています。一方、実態として、必ずしもデータ利用の必要性が先に十分でないケースもあり、この場合データ整備はその状況に合わせた整備度合いになります。そうした状況からデータ利用を始めようにも、データ整備がされていないと利用も進まないという鶏と卵の問題になってしまいます。このような場合、一律にデータメッシュを適用するのではなく、中央からリソースを投下して整備するアプローチをブレンドする必要があると考えています。

2. 分析利用チームとドメイン間で品質基準のズレが生じる

当社では主にプロダクトをドメインの境界線としていますが、あるドメインのデータに対して、(目的適合性は守りつつ) 高品質な分析がしたいというケースが出てきています。各ドメインは困っていないのに、分析者が困るという問題です。

ドメインと分析者の境界線の切り方の問題でもあると思いますが、少なくとも現状の仕組みだけでワークさせるのは限界が見えてきました。この課題を解決するため、アナリティクスエンジニアの採用を開始しました(JDはこちら)。データをビジネス価値のあるモデルに変換し、ドキュメントを整備し、品質を保証する役割を拡充することで、来年以降、より再現性高く高度な分析を実現する世界を作っていきたいと思っています。

最後に

6月のシリーズD調達を終え、組織としてもプロダクトとしても新たな挑戦が始まっています。 またどこかで語れればと思いますが、データ組織の来年の重点テーマとしては、以下を考えています。

  • プロダクトM&Aおよびマルチプロダクト間データ連携による提供価値の深化
  • データ基盤の本格的なテコ入れ
  • 生成AIによる新しい医療体験の創出

カケハシのデータ組織は、医療という巨大で複雑なドメインに対し、技術と情熱を持って取り組む仲間を求めています。「データで医療に貢献したい」「難解な課題に挑戦したい」という方、ぜひ一度お話しさせてください! 明日のAdvent Calendarは、カケハシの名物Engineering Manager 小田中さんの担当です。そちらもお楽しみに!