Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save yoshifuji/d6a8d0eece3d6fa5076009ca59acb2b5 to your computer and use it in GitHub Desktop.
Save yoshifuji/d6a8d0eece3d6fa5076009ca59acb2b5 to your computer and use it in GitHub Desktop.
#2-1_増えているデータエンジニア
業種 募集要項にある仕事内容
EC ・サプライチェーン、マーケティング、商品企画等の各領域における業務ヒアリングやデータ分析のTOBE明確化、方針決定や要件定義
・全社的なデータ基盤構築に向けたアーキテクト設計や技術検証
・社内の各システムを疎結合するデータレイクやETL、API等のサーバーサイド開発
・ECデータトラッキング/ユーザーレポート画面のフロントエンド開発
・A/Bテスト等を駆使したデータ分析の実施、或いはそれを社内展開する分析基盤の開発
・機械学習技術を用いたデータの可視化や業務自動化
・自社ECにおけるデータマーケティング機能(DMP/検索/レコメンド/接客等)の開発や運用
EC ■データ基盤の構築・運用
・データソースをデータチームが所有するBigQueryへ繋げる
・ビジネスチームが利用するCRM等のツールを連携
・GCPプロジェクトのセキュリティ対策、運用
・データ設計や自動化などの仕組み作り
・BIツールの構築・運用
・MLバッチの実行環境の整備
■データ計測の仕組みの構築・運用
・マーケティングの効果測定するための計測環境を整える
・各サービス上で必要となるデータ計測の仕組みを提案・実装する
■社内でのデータ利活用の推進
・BigQueryに集約したデータを活用し、関連業務のヒアリング
・業務データ連携やスプレッドシートの更新自動化
IT ・視聴質データを加工し利用しやすい形で格納するための基盤開発/ETL改善
・顧客ニーズに応じた商品のシステムへの実装、商品化に向けたデータ基盤の整備
・顧客向けwebサービスに利用するデータマートの設計/開発
・各種メタデータ(テレビ番組・CMなどの付加データ)の加工/整備
・社内向けデータ抽出基盤(Redash)のデータ要件定義/運用/開発/テスト
・データの品質を担保するためのテストの企画/設計/開発/運用
コンサル プロダクト、ビジネスのデータ分析をするためのデータを集約する、分析基盤のデータエンジニアとして、下記の業務に取り組む。
・データアナリストとともに社内ステークホルダとの要件定義
・要件を元にした抽出ロジック、アルゴリズムの開発
・セキュリティ要件を満たした基盤の設計と運用
・ETLツール、ジョブスケジューラの運用
・データ抽出バッチの管理
・データウェアハウスの設計、構築、運用
・BIツールの管理、運用
・データサイジング、コスト管理
メディア リアルタイムに蓄積される1日450GB以上、約1億レコードの読者の動きや記事情報といったデータを取り扱うデータ分析環境の開発・運用を担当する。
・データ収集・分析基盤の運用や整備
・ビッグデータを扱う新技術選定、評価や構築
医薬 ・分析要件に必要なテーブル、ログの定義設計
・AWS Glue Job(Spark) を利用したETL処理の設計開発
・Airflowを利用したデータパイプラインの開発運用
・効率的なデータ活用を推進するための中間テーブル設計
・Amazon SageMakerを利用したデータ分析
金融 ・行内外のデータ収集、オンプレミスとAWS双方でのETLを使用したデータ移出入、自動化プロセスの構築
・各種プロジェクトにおけるモデル実装のようなデータサイエンス領域のバックエンド開発
・データカタログの整備、データ保全のためのデータマネジメント/モニタリング
・AWSにおけるデータ分析環境整備(EC2や各種マネージドサービスを利用)
・外部サービスとの連携するためのバックエンドAPIの開発/運用/保守
・クラウドやオープンソースの最新データ処理、分析技術の導入
広告 ・基幹DB(Oracle)や配信サーバのログをGCPへデータ転送の基盤改修と運用(Treasure Dataへの転送)
・BQ上でのDWH(データウェアハウス)やDM(データマート)の基盤構築、改修、運用
・BIツール開発、管理、運用
・データ保持に関するガバナンスとそのセキュリティ保持対応
・分析環境の刷新
小売 ■プロダクト開発にデータエンジニアとして参画
・ブランドオフィシャルのデータ分析基盤の開発(ブランド向け分析アプリケーションの開発・運用)
■全社共通データ基盤の設計・構築/データガバナンスの整備
・約50TBのアクセスログ・化粧品、ECや店舗などのサービスデータのETL実装
・分散しているデータ基盤を統合した全社共通データレイク&データウェアハウスのシステムアーキテクチャ設計と開発
・Google Cloud Platformのデータ関連サービス(BigQuery etc.)のコスト・IAM運用
人材 ・データ全体像をモデル化するとともに、データセットを抽出、データ交換のための手法を策定する
・複数のデータソースやシステムからデータを入手し、ビッグデータ・プラットフォームとして構築する
・データの全体像を理解、分析、およびマッピングする
・業務における当社の情報セキュリティ基準を維持する
・データサイエンティストとデータフィールドをマッピング、仮説立て、データ収集整理、検証、サイエンティストの解析モデル構築に貢献する
・インフラチームによる構築に向けて、必要なテクノロジースタックを決定する
・各機能とモデリングテーブルを構築するための定形プロセスを作る
製造 ・事業内容と事業課題に基づいた、データパイプラインの設計と実装及び運用
・事業部門やデータ分析チームのメンバーと連携したプロジェクトマネジメント
・Google Cloud Platform/Treasure Data/AWS/Salesforce/可視化ツールなどの連携実装と運用
製造 ・ データウェアハウス、データマートの開発と運用、改善
・ メタデータ管理システムの開発
・ ETL 処理の運用
・ ETL 処理基盤の開発, 運用
・ BIシステムの管理、サポート
・ 社内のデータ利用業務を支援するツール作成
・ SQLによるデータ抽出や分析の経験
・ データに関わる業務理解と、データドリブンな業務改善の支援
不動産 ETL基盤及び物件データ配信APIの開発およびインフラ設計・運用を担当する。
・物件データETL基盤の構築開発
・物件データ配信APIの構築開発
・サーバー構築の自動化
・アプリケーションのパフォーマンス監視や改善
・機微情報の暗号化やセキュア情報の保護
・インフラ運用(障害対応、ログ解析等)
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment