Microservices require a shift in mindset and tooling. As monitoring is changing with more focus on distributed tracing because of the changing needs, the incident response must also adopt. In this presentation, I’ll answer “why” and “how” of on-call and incident response in microservices.

 
3 favorite thumb_down thumb_up 0 comments visibility_off  Remove from Watchlist visibility  Add to Watchlist
 

Outline/Structure of the Keynote

Microservices solve a lot of problems, especially once the company scales. But this change doesn’t just require a change in how we build software, it also requires a change in how we operate the software. Once we talk about operations, we must ready to take the on-call and solve critical problems affecting our systems and essentially our users. With multiple services with dependencies and stakeholders, challenges like finding out the right team to handle the incidents, creating actionable alerts, and managing the incident response process arise. In this talk, I’ll talk about these challenges by giving the reasoning behind and propose some solutions to these real-world problems.

Learning Outcome

People will learn what they should expect and what they should do to manage incidents while running microservices.

Target Audience

People who run or want to run microservices on production

Prerequisites for Attendees

Know what a microservices is and how it is different than monoliths.

schedule Submitted 2 months ago

Public Feedback

comment Suggest improvements to the Speaker

  • Liked Gene Kim
    keyboard_arrow_down

    Gene Kim - Lessons Learned Since The Phoenix Project

    Gene Kim
    Gene Kim
    Founder
    Tripwire
    schedule 3 months ago
    Sold Out!
    60 Mins
    Keynote
    Beginner

    I’ve learned so much since The Phoenix Project came out in 2013. In this talk, I will share my top learnings while co-authoring The DevOps Handbook with Jez Humble, Patrick Debois, and John Willis and the recently-released Accelerate with Dr. Nicole Forsgren and Jez Humble. I’ll talk about the latest findings from the State of DevOps Report, the true importance of deployment lead times, how DevOps truly transforms the lives of Dev and Ops, what I learned about Conway’s Law, and how DevOps is a subset of dynamic learning organizations, of which Toyota is the most famous. This project was one of the most fun and rewarding adventures of my life, and I want to share some of my biggest a-ha moments!

  • Liked David Bernstein
    keyboard_arrow_down

    David Bernstein - Five Development Practices for Agile DevOps

    David Bernstein
    David Bernstein
    Owner
    To Be Agile
    schedule 3 months ago
    Sold Out!
    60 Mins
    Keynote
    Beginner

    These five development practices are core to Extreme Programming (XP) and essential for DevOps—automating the build for continuously integrating software as it is written, collaborating with team members through pair programming, practicing Agile design skills that enable testability, using test-first development to drive design, and refactoring code to reduce technical debt. Together, these five technical practices are proving to be essential for sustained success with Agile DevOps. However, many teams haven’t been exposed to the benefits of these practices or understand how to use them effectively. David Bernstein explores these engineering practices and their use in reducing risk and building quality in at every level of the development process. He makes the business case for these practices by showing how they address the inherent risks and challenges of building software. David then examines how these XP practices help us address the core issues of software development.

  • Liked Takeshi Arai
    keyboard_arrow_down

    Takeshi Arai / Kota Mikawa - トラディショナルな企業でズンズン歩んだ積み木細工のDevOps

    45 Mins
    Talk
    Beginner

    積み木細工(またはジェンガ)とプレハブ

    技術とオペレーションとチーム開発と文化醸成をビジネスの視点を持ちながら、そしてoutcomeを意識しながら実践していった話をさせていただきます。

    同時多発的にアジャイル、カンバン、クラウド、カイゼンをガシガシとチーム単位で導入していったら会社のカルチャーも変わっていきました。ある種積み木のように、意欲のあるメンバーがそれぞれに積み上げて、受け入れられたものが根付いています。今振り返るとこれをDevOpsと言っても良いのかも。

    43年続いているトラディショナルな企業でも、そしてプレハブのように型通りの導入でなくとも、ボトムアップからここまでできるんだという事例とその術を伝えられたらと思います。

  • Liked Mitsuyuki Shiiba
    keyboard_arrow_down

    Mitsuyuki Shiiba - サービス運用を考えながら開発をするということ

    20 Mins
    Talk
    Beginner

    サービス運用を考えながら開発をするということについてお話します。

    僕は、楽天の大阪支社でウェブアプリケーションエンジニアとして仕事をしています。実はDevOpsという言葉を聞いてもいまいちピンと来ないなぁと思っていたのですが、それは僕のいる部署が1つのチームでサービスの開発と運用の両方をやっているからだなと気づきました。

    サービスの開発と運用の両方をやっているため「運用を考えて開発をする」ということを考えやすい環境にあると思います。運用のことを考えずに開発をすると全てが自分たちに跳ね返ってくるからです。

    新しいエンジニアが入ってくると「運用のことを考えながらコードを書くんですよ」って話をして設計やコードのレビューをするし、新しいプロデューサーに対しては「ビジネスの運用が回るかどうか考えましょう」って一緒に話をします。

    このセッションでは、サービスの運用を考えながら開発をするときに、設計やコードでどのようなことを考えるか、テストやドキュメントをどのように残すのか、ビジネスの運用について何を考えるか、について自分の経験を元にお話したいと思います。

  • Liked Hideya Ikeda
    keyboard_arrow_down

    Hideya Ikeda - 富士通のSIプロジェクトがどのようにDevOpsに取り組んでいるか

    Hideya Ikeda
    Hideya Ikeda
    Manager
    FUJITSU LIMITED
    schedule 2 months ago
    Sold Out!
    45 Mins
    Talk
    Intermediate

    SIビジネスはなくなると言われ始めて数年、富士通のビジネスの中心はまだまだSIです。

    • ウォーターフォール、多層請負契約が中心のSIプロジェクトがDevOpsというテーマにどう取り組んでいるのか?
    • 富士通のSIプロジェクトは年間数千件。どのように標準化、適用推進活動をしているのか?
    • これらのSIプロジェクトでは、どんなツールを使って、どんなプラクティスを実践しているのか?
    • DevとOpsを隔てる壁へのアプローチは?
    • そして、今後SIビジネスがなくなっていくことにどう備えているか?

    こういった内容を泥臭い実践事例や苦労話を交えてお話ししたいと思います。

  • Liked T. Alexander Lystad
    keyboard_arrow_down

    T. Alexander Lystad - Large Scale DevOps Transformation

    T. Alexander Lystad
    T. Alexander Lystad
    Chief Cloud Architect
    Visma
    schedule 2 months ago
    Sold Out!
    45 Mins
    Talk
    Beginner

    Visma is the largest cloud software developer in Northern Europe with 8000+ employees. Over the past four years, Visma has worked in a focused and structured way to modernize how we design, develop, deliver and operate our cloud services. We now have 40 autonomous teams that are responsible for both development and operations of their cloud services. How did we get here, and what have we learned along the way?

    This is an updated version of a talk I held at DevOpsDays Oslo 2018.

  • Liked Jan Schilt
    keyboard_arrow_down

    Jan Schilt - How the Phoenix Project simulation supports DevOps mindset change

    Jan Schilt
    Jan Schilt
    CSD
    GamingWorks BV
    schedule 2 months ago
    Sold Out!
    45 Mins
    Others
    Intermediate

    We ran 100+ DevOps simulations around the world for many large organizations. Our partners did 1000+ in the last 3 years. We experienced a lot of key fail and succes factors during the DevOps journeys. We capture all the outcomes in this presentation. DevOps requires a mind shift for most of the employees. We call this a 'new way of working' in which Old Thinking and Old Doing, will be replaced by New Thinking and New Doing. This is a process of years. But with simulation we can make a real good first step in his journey.

    We will present how this new way of working looks like, and why it's so difficult to change.

    We will present how DevOps benefits from learning by doing and how to bring this new way of working a live by changing the mindset.

    We also show some real cases how large organisations like ABN AMRO, NXP, APG etc used simulations to change the mindset of the employees.

    We also will explain the management of change aspects that plays an important role during this transformation.

  • Liked Genki Sato
    keyboard_arrow_down

    Genki Sato - 開発効率を最大化するデプロイメントパイプライン

    Genki Sato
    Genki Sato
    Tech Lead
    Yappli
    schedule 2 months ago
    Sold Out!
    20 Mins
    Talk
    Beginner

    Yappliでは、プログラミング不要で簡単にスマフォのネイティブアプリを作成して、公開できるプラットフォームを280社のお客様に提供しています。

    私達が開発した価値をプラットフォーム上にすばやく、安全にデプロイするためには、パイプラインを整備し、自動化することが重要になってきます。
    パイプラインを整備することで、マスターへのマージに対する心理的な障壁を下げ、デプロイを自動化することで、効率的な運用が可能になります。

    このセッションでは、SaaSを運用している事業者として、最低限取り組むべき内容について、Yappliで実装した知見とともにお伝えしたいと思います。

  • Liked Hikita Keiichi
    keyboard_arrow_down

    Hikita Keiichi - Terraform で自社サービスを便利に! Custom Provider開発に関する取り組みのご紹介 〜かゆいところに手を届かせたい人へ〜

    45 Mins
    Talk
    Intermediate

    NTTコミュニケーションズでは自社クラウドとして "Enterprise Cloud 2.0(以下ECL2.0)" というサービスを提供している。

    私達のチームでは、現在上記サービス向けのオーケストレーション機能の開発を行っており、具体的には "Terraform" に対するプラグイン(Terraformの用語でCustom Providerと呼ぶ)の開発によりこれを実現しようとしている。

    Terraform自体はHashiCorp社により開発されたDevOpsツールであり、クラウド上のリソースを定義ファイルの状態に合致するように生成・操作が可能である上、APIを保有するシステム(ECL2.0も同様)であればCustom Providerを開発することでこのツールに組み込むことができ、利便性・拡張性が非常に高い。

    一方で、Custom Provider開発を通じたCI、特にリグレッションの観点で見ると、いくつか考え無くてはならない課題があるとも感じており、私達のチームではそれに対して各種の工夫を交えながら開発を進めてきた。

    本プレゼンテーションでは、Terraformのご紹介、Custom Provider開発の進め方についてのご説明、Custom Provider開発の過程を通じて感じた課題や具体的な改善点(自分たちの実際の実装方法)や様々なTips(実は意外とかゆいところに手が届く使い方がちゃんとできる!)等について、コードの紹介やデモを交えてご紹介させて頂く。

  • Liked Masato Ishigaki
    keyboard_arrow_down

    Masato Ishigaki - Data-Driven x DevOpsで実現する『データ駆動戦略』

    Masato Ishigaki
    Masato Ishigaki
    Product Owner
    DMM.com
    schedule 3 months ago
    Sold Out!
    20 Mins
    Talk
    Beginner

    ユーザーエンゲージメントを高める中で『データ駆動』という考え方は非常に重要です。
    常にプロダクトの状態をデータドリブンで数値化・定量化して、プロダクトがきちんとGrowthしているか、あるいはしそうかどうかを判断・予測しなければなりません。

    データが『駆動』するとは、データを見ることで次の行動につながることです。また、優れた指標をもとにデータを集めなければデータは駆動しません。

    データ駆動を使ったプロダクト戦略を行ううえで、優秀なフレームワークとして『リーンスタートアップ』といった考え方があります。リーンキャンパスやBMLループなどを使って、仮説検証からデータ計測→学習を高速に回し、次の仮説を立案し、いち早くプロダクトをProduct Market Fitに到達させる必要があります。

    こういった仮説から学習のループをすばやく回すには、DevOpsをどう効率よく回しどういったデータを計測してモニタリングしていくかがとても大事になってきます。 間違った指標(データ)では、学習ができないからです。

    今回は、データが駆動する優れた指標の見つけ方から、DMM.comの多様なサービスから月数万のレビュー投稿されるユーザーレビュー基盤のプロダクト実例をもとにデータ駆動戦略についてお話できればと思います。

  • Liked Kohsuke Kawaguchi
    keyboard_arrow_down

    Kohsuke Kawaguchi - Wasted Gold Mine & What Data Can Do To DevOps

    Kohsuke Kawaguchi
    Kohsuke Kawaguchi
    CTO
    CloudBees, Inc.
    schedule 1 month ago
    Sold Out!
    20 Mins
    Talk
    Intermediate

    As CTO of CloudBees and the creator of Jenkins, I get to see lots of real-world software development. Our automation in software development is sufficiently broad that it is producing lots of data, but by and large most of those are simply thrown away. Yet at the same time, the management is feeling like they are flying blind because they have little insight! In this talk, Kohsuke will discuss how we collectively seem to miss the golden opportunity to improve the software development process itself, based on data. IOW, learning is lacking at the organizational level, let alone "machine" learning!

  • Liked Arata Fujimura
    keyboard_arrow_down

    Arata Fujimura - DevOps導入支援、始めました

    Arata Fujimura
    Arata Fujimura
    Manager
    Classmethod, Inc.
    schedule 2 months ago
    Sold Out!
    20 Mins
    Talk
    Beginner
    クラスメソッド社では2018年7月から、DevOps導入支援サービスを始めました。
    一般的にDevOpsという言葉の定義は明確ではありません。そこで、支援サービスを始める上でまずは我々なりのDevOpsの定義を行ない、リーンキャンバスなどを使って仮説を立て、仮説の検証を行ないながら支援サービスの方向性を模索してきました。
    当セッションでは、DevOps導入支援サービスの立ち上げから今に至るまでにやってきたこと、その結果からわかったこと、次にやろうとしていることについて、ざっくばらんにお話しさせて頂きます。
  • Liked h-arai
    keyboard_arrow_down

    h-arai / Kenta Sasa - Value Stream Mapping ワークショップ

    120 Mins
    Workshop
    Beginner

    Value Stream Mapping ワークショップです。 Value Stream Mappingを使ったプロセスの見える化・カイゼン案の検討を実際に体験してみましょう。

    Value Stream Mapping = ソフトウェア開発工程の流れ(価値の流れ)を見える化するために作成するプロセス図です。アイデアが生まれてから顧客に対して価値が届くまでの全行程を見える化することによって、ムダな作業や非効率なフローをチーム内で共有することができるようになるため、カイゼンに役立てることができます。

    4、5人でグループを作ってグループワークを行います。Value Stream Mapping が描けるようになるだけではなく、チームで作った時の効果も感じられると思います。

  • Liked Seiji Kawakami
    keyboard_arrow_down

    Seiji Kawakami - DevOpsに関わるPOとして大切なこと

    Seiji Kawakami
    Seiji Kawakami
    Scrum Master
    KDDI
    schedule 1 month ago
    Sold Out!
    20 Mins
    Talk
    Intermediate

    DevOpsを上手に回すために、開発チームとビジネスが一体となって動く必要があります。

    一言でビジネスと言っても多種多様なセクションを含んでおり、なかなか一人で全てを回すことは現実的に難しい状況だと思います。

    上手くDevOpsを回すための作戦としPOチームを組閣、社内の業務改善プロジェクトがどのように動いていったのか?

    実際にPOチームに編入されたメンバーと、開発チームの双方の立場からプロジェクトを振り返ります。

  • Liked Atsushi Fukui
    keyboard_arrow_down

    Atsushi Fukui / Yukitaka Ohmura - DevOps with Database on AWS

    20 Mins
    Talk
    Beginner

    DevOps のアプローチでシステム開発に取り組む上で、データベースに対する変更をどのように扱うかは難しい問題です。このセッションでは、ライフサイクルが異なるアプリケーションとデータベースに対する変更を適切に管理することを目的として、代表的なデータベーススキーマ変更の手法を紹介し、それを CI/CD パイプラインに組み込む方法について考えます。

  • Liked Shingo Kitayama
    keyboard_arrow_down

    Shingo Kitayama - DevOps accelerates Digital Transformation - 組織でどのようにDevOpsを促進させるのか -

    45 Mins
    Talk
    Intermediate

    DevOpsは、組織のデジタルトランスフォーメーションを推進するために、いまや必須のアプローチです。

    IDCの調査結果によると、2018年の国内企業におけるDevOps実践率は上昇し、2019年も引き続き多くの企業がDevOpsを実践すると予想されます。その一方で、実践の効果が出ている企業はまだ少なく、経済産業省が提唱する「2025年の崖」という既存システムの課題を数多く抱えながら、試行錯誤する企業も多くあります。

     デジタルトランスフォーメーションを推進する上では、アジャイルな開発体制、Kubernetesを活用したアプリケーション開発プロセス、クラウドネイティブな開発プラットフォームといった要素が欠かせません。しかし、Kubernetesを顧客に提案していく中で見えてきた課題は、そもそもチームの目標(Key Goal Indicator)が不明確といったものでした。

     本講演では、「2025年の崖」や「Accelerate: The Science Behind Devops」をベースとして、企業がどのようなプロセスでDevOpsを推進すべきかを紹介していきます。

  • Liked David Nguyen
    keyboard_arrow_down

    David Nguyen / Michael Migliacio - Design an Enterprise Library for React Components

    45 Mins
    Talk
    Advanced

    There are an increasing number of engineering teams adopting React to build their e-commerce solutions, or high performance single page applications for any business sectors.

    As the adoption increases, there is also the need to create, and publish reusable react components to share across teams. Come join David and Michael to hear how their web UI/UX engineering team laid the foundation for this effort. They will review the process through which, the core decisions were made. The presentation will discuss the options and considerations for a component library development environment. They will share important lessons learned while exploring the many ways of handling style and themes for reusable components and the tradeoffs. Audience will learn the importance of automated testing for the components created, as well as continuous integration to assure no one breaks the build. Finally, they will share about component publishing, what they had to consider prior to distribution, whether to an internal or public repository for consumers.

  • Liked Julian Totzek-Hallhuber
    keyboard_arrow_down

    Julian Totzek-Hallhuber - There is no such thing as DevSecOps!

    20 Mins
    Talk
    Intermediate

    DevOps/DevSceOps is a journey and requires a lot of changes in your organization and the affected teams. I would like to take you on a journey from waterfall to DevSecOps. Looking at the traditional approach and the issues you will face or you are actually facing while implementing DevOps. Moving on with what will happen if you set up DevOps without security and finishing with best practices approaches and tips how to get security included in your DevOps process to finally implement a full, secure DevSecOps process.

  • Liked Stacy Goh
    keyboard_arrow_down

    Stacy Goh - Infrastructure as Code - the good, the bad and the ugly

    20 Mins
    Talk
    Beginner

    “Ten minutes later and it was up”. Said no one from operations ever. But all that is changing with what we know as Infrastructure as Code (IaC).

    IaC is a fairly recent concept that allows us to reap benefits such as replicability and automated company policy compliance. Think being able to set up complex networked servers that comply to your company’s security policies just by compiling code. Oh, and you can do it not just once, but twice, and thrice, and... You get the idea. Orchestrating servers is never an envious job, but with IaC, that seems to be changing.

    In just 20 minutes, I will be sharing on beginning my journey with IaC - how it makes life in a DevOps capable team easier, how infrastructure is made more accessible to developers, what additional troubles it’s brought us, and some personal nasty experiences working with IaC.

    And of course, a little real life code to get you started with IaC!

  • Liked Serhat Can
    keyboard_arrow_down

    Serhat Can - Building a healthy on-call culture

    Serhat Can
    Serhat Can
    Technical Evangelist
    Atlassian
    schedule 2 months ago
    Sold Out!
    45 Mins
    Talk
    Beginner

    Paging people just creates a series of problems unless you put enough resources to build a healthy “on-call” culture. Nobody wants to be buried into alerts or wake up at 2 am in the morning.

    There are several points you have to take into account to make on-call suck less. At the center of each of these items, there are people. If you put your people at the center and design your incident response thinking about them in the first place, on-call becomes a competitive advantage.

    In this presentation, Serhat will start defining on-call and why we need a robust on-call culture. At this point, he’ll mention the impact of downtime and performance degradation such as direct revenue, and credibility losses. Then, continue listing 6 must-haves:

    - Be transparent

    - Share responsibilities

    - Get ready for wartime

    - Build resilient and sustainable systems

    - Create actionable alerts

    - Learn from your experiences

    In each of these steps, there will be crucial points and pieces of advice to both developers and management systems. In the end, Serhat will show that our efforts in building a better on-call culture, will pay off as our people and user’s happiness.