【会社紹介】 株式会社Linc’wellは、2018年の設立より「テクノロジーを通じて、医療を一歩前へ」をミッションに、非効率な医療現場をテクノロジーによって効率化し、患者さんの利便性と医療の質の向上を目指した事業展開を行っています。 オンライン・オフラインで医療従事者・患者/ユーザーをつなぐヘルスケアプラットフォーム事業を主力としており、「オンライン診療システム提供サービス」「クリニックDX支援サービス」「ヘルスケアECサービス」の3つのサービスを提供しています。 主力事業のオンライン診療プラットフォーム「クリニックフォアのオンライン診療」では、患者の医療体験に徹底的にフォーカスしたオンライン診療システムを医療機関に提供し、デジタル実装やマーケティング・CRM支援等を手掛けています。 【募集背景】 事業の急成長に伴い、累計診療実績は800万件を突破しました。この拡大する医療プラットフォームを支えるため、「リライアビリティ&セキュリティチーム」ではシステムの信頼性・安全性の強化を進めています。 現在、EM(エンジニアリングマネージャー)と共に、技術的な側面からチームを牽引し、SREプラクティスの実装をリードしていただける即戦力のSREを募集します。 【プロダクト・課題】 弊社が提供するサービスの全てに横断的に関わっていただきます。 現在、サービスの急拡大に伴い、運用の仕組み化やスケーラビリティの確保が急務となっています。既存の運用フローを見直し、コードによる管理(IaC)や自動化を推進することで、「個々人が頑張る運用」から「システムが守る運用」への転換を求めています。 単なるインフラ構築に留まらず、開発チームと連携して「開発スピード」と「安全性」の両立を実現する開発基盤の構築にも携わっていただきます。 具体的には、以下のような課題があります。 ・インシデント対応において、障害対応やインシデントコマンダーを担えるメンバーが限られており、対応プロセスや判断基準の標準化・再現性の向上 ・構成やアプリケーション仕様、過去の経緯に依存した部分が多く、ビジネス要件とモノリシックなアプリケーションの最適化の推進 ・セキュリティについては、3省2ガイドラインへの対応や AWS セキュリティ成熟度モデルを活用しながら、一時的な対策ではなく、継続的に強化していく体制づくり これらの課題に対し、SREとしての専門性を活かしながら、運用・設計・仕組みの観点から改善を推進していただきます。 【業務内容】 信頼性向上のためのリアーキテクチャ・運用改善 ・高可用性が求められる医療プラットフォームにおいて、段階的なリアーキテクチャ・運用改善の推進 ・AWS/GCPを用いたインフラの設計・構築・運用(TerraformによるIaC化を徹底) ・SLO/SLIの策定・運用および、Datadog等を用いた可観測性(Observability)の向上 (サービス横断での信頼性指標の定義・改善) 開発生産性の向上(Developer Experience) ・複数サービス・チームが関わる環境における、CI/CDパイプライン(CircleCI, GitHub Actions等)の高速化・安定化 ・コンテナ技術(ECS/Fargate)を活用したデプロイフローの改善 セキュリティ・障害対応 ・医療ドメインの要件を踏まえた、脆弱性診断やWAFの設定など、セキュリティ対策の企画・実行 ・障害発生時の対応リードおよび、ポストモーテム(事後分析)による再発防止策の策定 技術リード・組織貢献 ・技術選定やアーキテクチャ設計における意思決定のリード ・開発チームと連携した SRE(DevOps)プラクティスの浸透・啓蒙活動 【チームの特徴】 ・毎週の定例およびデイリースタンドアップにて各自の進捗を把握しながら、改善・構築を進めています ・フルリモート勤務ですがコミュニケーションを重要視しており、日頃のSlack等を使った非同期コミュニケーションだけでなく、Slack HuddleやGoogle Meetを使ったクイックな同期コミュニケーション、バーチャルオフィス(gather)を使ったコミュニケーションをしやすい環境づくりなど、チーム全体でコミュニケーションしやすい雰囲気となっています ・他の部署含め家庭を持ったメンバーが多いため、子育ての大変さや柔軟な働き方の必要性を全員が理解しています 【当ポジションの魅力】 ・立ち上げから1年程度であり、どのように開発生産性を高めていくのか、よりプロダクト開発に集中する環境を作るか、ご自身の考えを業務に反映する裁量があります ・取り組んでいただく技術的・組織的な課題の多くは、必要な知識が分野横断的なものが多く、技術と経験の幅を広げる機会があります ・プロダクトにおける難度の高い課題において、プロダクト開発に関わるエンジニアのサポートのために、新しい技術や考え方を調査・検証・適用・展開する機会があります ・800万件以上の実績を持つプラットフォームにおいて、トラフィック増やデータ増大に耐えうるアーキテクチャへの刷新に、裁量を持って取り組めます。 【開発環境】 ・言語/フレームワーク: Ruby, Ruby on Rails, TypeScript, React, Next.js, Dart, Flutter, GraphQL ・インフラ/監視: AWS(主に ECS Fargate, CloudFront, Lambda), GCP(主にデータ分析基盤としてBigQuery), Datadog ・データベース: PostgreSQL ・CI/CD: CircleCI, Autify, AWS CodePipeline, GitHub Actions ・IaC: Terraform ・データ分析: metabase, Amplitude, BigQuery ・デザイン: Figma ・ソースコード管理: GitHub ・コミュニケーションツール: Slack ・情報共有ツール: Notion