Microservices require a shift in mindset and tooling. As monitoring is changing with more focus on distributed tracing because of the changing needs, the incident response must also adopt. In this presentation, I’ll answer “why” and “how” of on-call and incident response in microservices.

 
3 favorite thumb_down thumb_up 0 comments visibility_off  Remove from Watchlist visibility  Add to Watchlist
 

Outline/Structure of the Keynote

Microservices solve a lot of problems, especially once the company scales. But this change doesn’t just require a change in how we build software, it also requires a change in how we operate the software. Once we talk about operations, we must ready to take the on-call and solve critical problems affecting our systems and essentially our users. With multiple services with dependencies and stakeholders, challenges like finding out the right team to handle the incidents, creating actionable alerts, and managing the incident response process arise. In this talk, I’ll talk about these challenges by giving the reasoning behind and propose some solutions to these real-world problems.

Learning Outcome

People will learn what they should expect and what they should do to manage incidents while running microservices.

Target Audience

People who run or want to run microservices on production

Prerequisites for Attendees

Know what a microservices is and how it is different than monoliths.

schedule Submitted 4 months ago

Public Feedback

comment Suggest improvements to the Speaker

  • Liked Gene Kim
    keyboard_arrow_down

    Gene Kim - Lessons Learned Since The Phoenix Project

    Gene Kim
    Gene Kim
    Founder
    Tripwire
    schedule 5 months ago
    Sold Out!
    60 Mins
    Keynote
    Beginner

    I’ve learned so much since The Phoenix Project came out in 2013. In this talk, I will share my top learnings while co-authoring The DevOps Handbook with Jez Humble, Patrick Debois, and John Willis and the recently-released Accelerate with Dr. Nicole Forsgren and Jez Humble. I’ll talk about the latest findings from the State of DevOps Report, the true importance of deployment lead times, how DevOps truly transforms the lives of Dev and Ops, what I learned about Conway’s Law, and how DevOps is a subset of dynamic learning organizations, of which Toyota is the most famous. This project was one of the most fun and rewarding adventures of my life, and I want to share some of my biggest a-ha moments!

  • Liked David Bernstein
    keyboard_arrow_down

    David Bernstein - Five Development Practices for Agile DevOps

    David Bernstein
    David Bernstein
    Sr. Consultant
    To Be Agile
    schedule 5 months ago
    Sold Out!
    60 Mins
    Keynote
    Beginner

    These five development practices are core to Extreme Programming (XP) and essential for DevOps—automating the build for continuously integrating software as it is written, collaborating with team members through pair programming, practicing Agile design skills that enable testability, using test-first development to drive design, and refactoring code to reduce technical debt. Together, these five technical practices are proving to be essential for sustained success with Agile DevOps. However, many teams haven’t been exposed to the benefits of these practices or understand how to use them effectively. David Bernstein explores these engineering practices and their use in reducing risk and building quality in at every level of the development process. He makes the business case for these practices by showing how they address the inherent risks and challenges of building software. David then examines how these XP practices help us address the core issues of software development.

  • Liked Hikita Keiichi
    keyboard_arrow_down

    Hikita Keiichi - Terraform で自社サービスを便利に! Custom Provider開発におけるDevOpsへの取り組みのご紹介 〜かゆいところに手を届かせたい人へ〜

    45 Mins
    Talk
    Intermediate

    NTTコミュニケーションズでは自社クラウドとして "Enterprise Cloud 2.0(以下ECL2.0)" というサービスを提供している。

    私達のチームでは、現在上記サービス向けのオーケストレーション機能の開発を行っており、具体的には "Terraform" に対するプラグイン(Terraformの用語でCustom Providerと呼ぶ)の開発によりこれを実現しようとしている。

    Terraform自体はHashiCorp社により開発されたDevOpsツールであり、クラウド上のリソースを定義ファイルの状態に合致するように生成・操作が可能である上、APIを保有するシステム(ECL2.0も同様)であればCustom Providerを開発することでこのツールに組み込むことができ、利便性・拡張性が非常に高い。

    一方で、Custom Provider開発を通じたCI、特にリグレッションの観点で見ると、いくつか考え無くてはならない課題があるとも感じており、私達のチームではそれに対して各種の工夫を交えながら開発を進めてきた。

    本プレゼンテーションでは、Terraformのご紹介、Custom Provider開発におけるDevOpsの取り組みに関するご説明、Custom Provider開発の過程を通じて感じた課題や具体的な改善点やTips(実は意外とかゆいところに手が届く使い方がちゃんとできる!)等について、ツール/コードの紹介やデモを交えてご紹介させて頂く。

  • Liked T. Alexander Lystad
    keyboard_arrow_down

    T. Alexander Lystad - Large Scale DevOps Transformation

    T. Alexander Lystad
    T. Alexander Lystad
    Chief Cloud Architect
    Visma
    schedule 4 months ago
    Sold Out!
    45 Mins
    Talk
    Beginner

    Visma is the largest cloud software developer in Northern Europe with 8000+ employees. Over the past four years, Visma has worked in a focused and structured way to modernize how we design, develop, deliver and operate our cloud services. We now have 40 autonomous teams that are responsible for both development and operations of their cloud services. How did we get here, and what have we learned along the way?

    This is an updated version of a talk I held at DevOpsDays Oslo 2018.

  • Liked Genki Sato
    keyboard_arrow_down

    Genki Sato - 開発効率を最大化するデプロイメントパイプライン

    Genki Sato
    Genki Sato
    Tech Lead
    Yappli
    schedule 4 months ago
    Sold Out!
    20 Mins
    Talk
    Beginner

    Yappliでは、プログラミング不要で簡単にスマフォのネイティブアプリを作成して、公開できるプラットフォームを280社のお客様に提供しています。

    私達が開発した価値をプラットフォーム上にすばやく、安全にデプロイするためには、パイプラインを整備し、自動化することが重要になってきます。
    パイプラインを整備することで、マスターへのマージに対する心理的な障壁を下げ、デプロイを自動化することで、効率的な運用が可能になります。

    このセッションでは、SaaSを運用している事業者として、最低限取り組むべき内容について、Yappliで実装した知見とともにお伝えしたいと思います。

  • Liked Mitsuyuki Shiiba
    keyboard_arrow_down

    Mitsuyuki Shiiba - Service Operation Centered Development - サービス運用をまんなかにおいた開発

    20 Mins
    Talk
    Beginner

    サービス運用をまんなかにおいた開発についてお話します。

    僕は2010年から楽天の大阪支社でウェブアプリケーションエンジニアとして仕事をしています。僕のいる部署は中規模から小規模のたくさんのサービスを担当していて、1つのチームまたはグループでサービスの開発と運用の両方を担当しています。

    サービスの開発と運用の両方を担当しているため、僕らはサービスの運用のことを常に考えながら開発に取り組んでいます。運用のことを考えずに開発をすると全てが自分たちに跳ね返ってくるからです。

    このセッションでは、サービスの運用をまんなかに置いて開発をするときに、どのようなことを考えるか、また、どのように他のチームや組織と向き合うか、について自分の経験を元にお話したいと思います。

    資料は英語ですが、セッションは日本語です。

  • Liked Takeshi Arai
    keyboard_arrow_down

    Takeshi Arai / Kota Mikawa - トラディショナルな企業でズンズン歩んだ積み木細工のDevOps

    45 Mins
    Talk
    Beginner

    積み木細工(またはジェンガ)とプレハブ

    技術とオペレーションとチーム開発と文化醸成をビジネスの視点を持ちながら、そしてoutcomeを意識しながら実践していった話をさせていただきます。

    同時多発的にアジャイル、カンバン、クラウド、カイゼンをガシガシとチーム単位で導入していったら会社のカルチャーも変わっていきました。ある種積み木のように、意欲のあるメンバーがそれぞれに積み上げて、受け入れられたものが根付いています。今振り返るとこれをDevOpsと言っても良いのかも。

    43年続いているトラディショナルな企業でも、そしてプレハブのように型通りの導入でなくとも、ボトムアップからここまでできるんだという事例とその術を伝えられたらと思います。

  • Liked Masato Ishigaki
    keyboard_arrow_down

    Masato Ishigaki - Data-Driven x DevOps

    Masato Ishigaki
    Masato Ishigaki
    Product Owner
    DMM.com
    schedule 5 months ago
    Sold Out!
    20 Mins
    Talk
    Beginner

    DevOpsの領域だけでは対応しきれない、プロダクトのグロースの部分をData-Drivenの考え方でどういうふうに開発プロセスを補完していくかについて述べていきます。

    LeanStartupのBMLループを開発プロセスとして各ループ遷移(Learn→Idea,etc...)の中でどういったことを意識しながらData-DrivenとDevOpsの考え方を使ってプロセス設計していくかについて、KGI,CSF,KPIの設定からビッグデータ基盤・データ分析基盤、優れた指標などDMM.comの事例を用いりながら説明していくます。

  • Liked Arata Fujimura
    keyboard_arrow_down

    Arata Fujimura - DevOps導入支援、始めました

    Arata Fujimura
    Arata Fujimura
    Manager
    Classmethod, Inc.
    schedule 4 months ago
    Sold Out!
    20 Mins
    Talk
    Beginner
    クラスメソッド社では2018年7月から、DevOps導入支援サービスを始めました。
    一般的にDevOpsという言葉の定義は明確ではありません。そこで、支援サービスを始める上でまずは我々なりのDevOpsの定義を行ない、リーンキャンバスなどを使って仮説を立て、仮説の検証を行ないながら支援サービスの方向性を模索してきました。
    当セッションでは、DevOps導入支援サービスの立ち上げから今に至るまでにやってきたこと、その結果からわかったこと、次にやろうとしていることについて、ざっくばらんにお話しさせて頂きます。
  • Liked Shingo Kitayama
    keyboard_arrow_down

    Shingo Kitayama - DevOps accelerates Digital Transformation - 組織でどのようにDevOpsを促進させるのか -

    Shingo Kitayama
    Shingo Kitayama
    Technical Architect
    Red Hat K.K.
    schedule 3 months ago
    Sold Out!
    45 Mins
    Talk
    Intermediate

    DevOpsは、組織のデジタルトランスフォーメーションを推進するために、いまや必須のアプローチです。

    IDCの調査結果によると、2018年の国内企業におけるDevOps実践率は上昇し、2019年も引き続き多くの企業がDevOpsを実践すると予想されます。その一方で、実践の効果が出ている企業はまだ少なく、経済産業省が提唱する「2025年の崖」という既存システムの課題を数多く抱えながら、試行錯誤する企業も多くあります。

     デジタルトランスフォーメーションを推進する上では、アジャイルな開発体制、Kubernetesを活用したアプリケーション開発プロセス、クラウドネイティブな開発プラットフォームといった要素が欠かせません。しかし、Kubernetesを顧客に提案していく中で見えてきた課題は、そもそもチームの目標(Key Goal Indicator)が不明確といったものでした。

     本講演では、「2025年の崖」や「Accelerate: The Science Behind Devops」をベースとして、企業がどのようなプロセスでDevOpsを推進すべきかを紹介していきます。

  • Liked Kohsuke Kawaguchi
    keyboard_arrow_down

    Kohsuke Kawaguchi - Wasted Gold Mine & What Data Can Do To DevOps

    Kohsuke Kawaguchi
    Kohsuke Kawaguchi
    CTO
    CloudBees, Inc.
    schedule 3 months ago
    Sold Out!
    45 Mins
    Talk
    Intermediate

    As CTO of CloudBees and the creator of Jenkins, I get to see lots of real-world software development. Our automation in software development is sufficiently broad that it is producing lots of data, but by and large most of those are simply thrown away. Yet at the same time, the management is feeling like they are flying blind because they have little insight! In this talk, Kohsuke will discuss how we collectively seem to miss the golden opportunity to improve the software development process itself, based on data. IOW, learning is lacking at the organizational level, let alone "machine" learning!

  • Liked h-arai
    keyboard_arrow_down

    h-arai / Kenta Sasa - Value Stream Mapping ワークショップ

    120 Mins
    Workshop
    Beginner

    Value Stream Mapping ワークショップです。 Value Stream Mappingを使ったプロセスの見える化・カイゼン案の検討を実際に体験してみましょう。

    Value Stream Mapping = ソフトウェア開発工程の流れ(価値の流れ)を見える化するために作成するプロセス図です。アイデアが生まれてから顧客に対して価値が届くまでの全行程を見える化することによって、ムダな作業や非効率なフローをチーム内で共有することができるようになるため、カイゼンに役立てることができます。

    4、5人でグループを作ってグループワークを行います。Value Stream Mapping が描けるようになるだけではなく、チームで作った時の効果も感じられると思います。

  • Liked Seiji Kawakami
    keyboard_arrow_down

    Seiji Kawakami - DevOpsに関わるPOとして大切なこと

    Seiji Kawakami
    Seiji Kawakami
    Scrum Master
    KDDI
    schedule 3 months ago
    Sold Out!
    20 Mins
    Talk
    Intermediate

    DevOpsを上手に回すために、開発チームとビジネスが一体となって動く必要があります。

    一言でビジネスと言っても多種多様なセクションを含んでおり、なかなか一人で全てを回すことは現実的に難しい状況だと思います。

    上手くDevOpsを回すための作戦としPOチームを組閣、社内の業務改善プロジェクトがどのように動いていったのか?

    実際にPOチームに編入されたメンバーと、開発チームの双方の立場からプロジェクトを振り返ります。

  • Liked Atsushi Fukui
    keyboard_arrow_down

    Atsushi Fukui / Yukitaka Ohmura - DevOps with Database on AWS

    20 Mins
    Talk
    Beginner

    DevOps のアプローチでシステム開発に取り組む上で、データベースに対する変更をどのように扱うかは難しい問題です。このセッションでは、ライフサイクルが異なるアプリケーションとデータベースに対する変更を適切に管理することを目的として、代表的なデータベーススキーマ変更の手法を紹介し、それを CI/CD パイプラインに組み込む方法について考えます。

  • Liked Hideya Ikeda
    keyboard_arrow_down

    Hideya Ikeda - 富士通のSIプロジェクトがどのようにDevOpsに取り組んでいるか

    Hideya Ikeda
    Hideya Ikeda
    Manager
    FUJITSU LIMITED
    schedule 4 months ago
    Sold Out!
    45 Mins
    Talk
    Intermediate

    SIビジネスはなくなると言われ始めて数年、富士通のビジネスの中心はまだまだSIです。

    • ウォーターフォール、多層請負契約が中心のSIプロジェクトがDevOpsというテーマにどう取り組んでいるのか?
    • 富士通のSIプロジェクトは年間数千件。どのように標準化、適用推進活動をしているのか?
    • これらのSIプロジェクトでは、どんなツールを使って、どんなプラクティスを実践しているのか?
    • DevとOpsを隔てる壁へのアプローチは?
    • そして、今後SIビジネスがなくなっていくことにどう備えているか?

    こういった内容を泥臭い実践事例や苦労話を交えてお話ししたいと思います。

  • Liked David Nguyen
    keyboard_arrow_down

    David Nguyen / Michael Migliacio - Design an Enterprise Library for React Components

    45 Mins
    Talk
    Advanced

    There are an increasing number of engineering teams adopting React to build their e-commerce solutions, or high performance single page applications for any business sectors.

    As the adoption increases, there is also the need to create, and publish reusable react components to share across teams. Come join David and Michael to hear how their web UI/UX engineering team laid the foundation for this effort. They will review the process through which, the core decisions were made. The presentation will discuss the options and considerations for a component library development environment. They will share important lessons learned while exploring the many ways of handling style and themes for reusable components and the tradeoffs. Audience will learn the importance of automated testing for the components created, as well as continuous integration to assure no one breaks the build. Finally, they will share about component publishing, what they had to consider prior to distribution, whether to an internal or public repository for consumers.

  • Liked Stacy Goh
    keyboard_arrow_down

    Stacy Goh - Infrastructure as Code - the good, the bad and the ugly

    20 Mins
    Talk
    Beginner

    “Ten minutes later and it was up”. Said no one from operations ever. But all that is changing with what we know as Infrastructure as Code (IaC).

    IaC is a fairly recent concept that allows us to reap benefits such as replicability and automated company policy compliance. Think being able to set up complex networked servers that comply to your company’s security policies just by compiling code. Oh, and you can do it not just once, but twice, and thrice, and... You get the idea. Orchestrating servers is never an envious job, but with IaC, that seems to be changing.

    In just 20 minutes, I will be sharing on beginning my journey with IaC - how it makes life in a DevOps capable team easier, how infrastructure is made more accessible to developers, what additional troubles it’s brought us, and some personal nasty experiences working with IaC.

    And of course, a little real life code to get you started with IaC!

  • Liked Julian Totzek-Hallhuber
    keyboard_arrow_down

    Julian Totzek-Hallhuber - There is no such thing as DevSecOps!

    20 Mins
    Talk
    Intermediate

    DevOps/DevSceOps is a journey and requires a lot of changes in your organization and the affected teams. I would like to take you on a journey from waterfall to DevSecOps. Looking at the traditional approach and the issues you will face or you are actually facing while implementing DevOps. Moving on with what will happen if you set up DevOps without security and finishing with best practices approaches and tips how to get security included in your DevOps process to finally implement a full, secure DevSecOps process.

  • Liked Serhat Can
    keyboard_arrow_down

    Serhat Can - Building a healthy on-call culture

    Serhat Can
    Serhat Can
    Technical Evangelist
    Atlassian
    schedule 4 months ago
    Sold Out!
    45 Mins
    Talk
    Beginner

    Paging people just creates a series of problems unless you put enough resources to build a healthy “on-call” culture. Nobody wants to be buried into alerts or wake up at 2 am in the morning.

    There are several points you have to take into account to make on-call suck less. At the center of each of these items, there are people. If you put your people at the center and design your incident response thinking about them in the first place, on-call becomes a competitive advantage.

    In this presentation, Serhat will start defining on-call and why we need a robust on-call culture. At this point, he’ll mention the impact of downtime and performance degradation such as direct revenue, and credibility losses. Then, continue listing 6 must-haves:

    - Be transparent

    - Share responsibilities

    - Get ready for wartime

    - Build resilient and sustainable systems

    - Create actionable alerts

    - Learn from your experiences

    In each of these steps, there will be crucial points and pieces of advice to both developers and management systems. In the end, Serhat will show that our efforts in building a better on-call culture, will pay off as our people and user’s happiness.

  • Liked Lim Yang Wei
    keyboard_arrow_down

    Lim Yang Wei - To DevOps, or not, it's all about Trust, Freedom and Responsibility

    20 Mins
    Talk
    Beginner

    In our team, the thing that we valued most is how our codes are making impact to business. It can be deploying feature that create new profit, fixing bug, increasing deployment time and etc.

    Making impact means in the end codes have to be deployed to production. We never set rules related to deployment. Anyone, anytime, anywhere. We even do have so-called "First day deployment" operation which make sure new member make their first deployment to production within 24 hours since they join our team. How do we make sure that works ? We trust. In our team, everyone is AWS admin from the first day. We want make sure everyone has the essential tools to setting up infrastructure, coding, releasing, monitoring. Human being, when given trust they take full responsibilities. Responsibility to complete work and hence making impact to business.

    It sounds like psychology, right ? Or I will just say culture.

    In the end, it's all about trust, freedom and responsibility. Let me show you how and why we inject (or being injected) these cultures into our team, how we improve and make sure it's getting better.