500スプリントを支えるエンジニアリング基盤のつくり方

location_city Tokyo schedule Apr 9th 04:00 - 04:20 PM place Hall A

どうすればチームが自走し、安定して組織が拡大するのでしょうか?

組織が大きくなっていくとチームの数も増えていくと思います。

DevOpsを実現できるチーム作りでは、自動化やCI/CDなどの基盤となる仕組みを作っていくところから始まります。

ではその仕組みは0から作るのでしょうか?それともうまく行っているチームを参考にするのでしょうか?


もし、チームが増えるごとに0から仕組みを作っていては基盤作りだけで何日も、へたをすれば何週間も使ってしまうでしょう。

もし、他のチームを参考にしたなら、自分たちのチームに使えそうな部分を探し出すのに膨大な時間を費やしてしまかもしれませんね。

私が所属する組織でも同じようなことが起きました。

いくつかのチームを調べた結果、原因となっていたのは各チームが作った「秘伝のタレ」でした。

私たちは秘伝のタレの製造を防ぐために、共通のエンジニアリング基盤を作りました。

この基盤によってチームは素早くプロダクトの開発に着手でき、自走できるようになりました。

本セッションでは、私の組織で実現した、チームの自走を助け、安定して組織が拡大することを実現するエンジニアリング基盤について紹介します。

 
 

Outline/Structure of the Talk

  • 拡大組織と組織と増えるチーム
  • 実際に起こった問題とは
  • 原因の調査
    • どのように調査したのか
    • 事件は現場で起きている
    • 秘伝のタレ
  • 対策を考えてみる
    • 共通化
    • スケール
    • チームの自立
  • 実施したことの紹介
    • インフラの共通化
    • 一括管理の仕組みを構築
    • ノウハウの貯蓄
    • ノウハウの共有
    • 教育活動、勉強会
    • チームに入り込む
  • 見えてきた成果
    • 共通基盤の更新活動
    • チーム間の情報共有

Learning Outcome

  • 共通化の方法を知ることができる
  • チームを素早く自走させる方法を知ることができる
  • 安定して組織を拡大する方法を知ることができる

Target Audience

DevOpsを実践している人/共通化に興味がある人/組織の拡大に課題を抱えている人

Prerequisites for Attendees

特にありませんが以下のことを知っておくと理解が早いかもしれません。

  • DevOpsの概要
  • CI/CDの概要
schedule Submitted 3 months ago

Public Feedback

comment Suggest improvements to the Speaker

  • Liked Takao Oyobe
    keyboard_arrow_down

    Takao Oyobe / Ryutaro YOSHIBA (Ryuzee) - 帰ってきた朝まで生DevOps 〜結局DevOpsとはなんだったのか〜

    45 Mins
    Panel
    Beginner

    DevOpsという言葉の世界はますます拡がり、様々な○○Opsが生まれました。DevOpsDays Tokyoに集まったプロポーザルを見ても、たくさんのDevOpsがあることがわかります。定義を1つに統一する必要はないですが、自分の中のDevOpsを更新し続けることは大切だと思います。

    そこで今回の朝まで生DevOpsは「結局DevOpsとはなんだったのか」をテーマに、定義の話を超えてDevOpsから我々は何を学ぶべきなのかについて考えていきたいと思います。

    パネラーは随時追加していく予定です。
    また、このパネルディスカッションは飛び込み参加可能なオープンパネルディスカッションです。

  • Liked Shinnosuke Yata
    keyboard_arrow_down

    Shinnosuke Yata - MLOpsがどうあるべきなのかを考える

    20 Mins
    Talk
    Beginner

    MLOpsには、機械学習プロジェクトをより安定稼働させることが求められていると思います。そのためにあらゆるプロジェクトでモデルのデプロイ自動化やバージョン管理などが行われています。

    ただ、モデルの品質を保つための必要十分条件はデプロイ自動化のみでしょうか。そもそも、モデルの品質を担保するのは学習データの質と量で、最初から完璧なデータセットを用意するのは不可能であったり、ユーザーの傾向が日々変わる中で常にデータセットをメンテナンスしていく必要があり、デプロイ自動化のみでそれが為されるわけではないはずです。

    つまり、本来はサービスの中で予測に用いられたデータをモデルの学習につなげるサイクルを高速に何度も回せる仕組みがあるべきなのに、自分のプロジェクトも含め、多くの機械学習プロジェクトがなんらかの理由によってそこまでたどり着けていないもしくはその優先度が下がっているのではないかと考えられます。

    実際、機械学習はそれ単体で成り立つものではなくソフトウェアの一部として組み込まれることで初めてユーザーに価値を届けることができるため、システムの中でそのサイクルを回せる仕組みを作っていくことは可能です。したがって、MLOpsは機械学習モデルをソフトウェアの一部として考え、モデルのデプロイ自動化やバージョン管理だけでなくシステムの中での学習データ作成の半自動化によって、ソフトウェアとして価値を届けることがあるべき姿なのではないかと考えています。

    このセッションでは機械学習プロジェクトとMLOpsがこれからどうあるべきなのかを考え、自分たちのチームで取り組んでいる事例に基づいてお話します。