欧州のIndustry4.0などに影響を受け、2016年1月の新聞掲載を皮切りに始まったFactory-IoTプロジェクト。
世界130工場 2500もの製造ライン、数万あるといわれる設備をつないで、30%もの生産性の向上を図るというミッションを命じられた。
デンソーでは、ハードを用いたKAIZEN文化は進んでいた。しかし、ソフトになると、、、結局ベンダーパッケージを用いたIoTシステムを構築した。結果、目まぐるしい生産システムの変化の速さに追従できなかったのであった。
その後の2018年、クラウドやOSSの技術に優れたパートナーと協調し、「技術を手の内化」というスローガンのもと、内製のIoTシステムの開発に着手し、無事に2019年10月にカットオーバーに至った。そして、生産システムの変化や現場の困りごとにスピーディに対応できるようになったのであった。
喜びもつかの間、予測できない接続設備の増加、9000TPSを超えるmessage数、急なネットワークトラブルによるデータ欠損、データ増による性能遅延、ユーザからの止まらない問合せや、各種申請、、、開発どころではなくなり、連日連夜、障害対策会議が開催されるのであった。
そこでは、IoTシステムでどんな問題が発生しているかの見える化(可観測性)、それから、如何に自動化を図りながらインシデントを解決し、サービスレベル(SLA/SLO)を向上させていくのか、落とし穴にはまりながら、埋めていった、その軌跡を自戒の念を込めて、発表させていただきます。