- 数据仓库管理;
- 在生产(包括提取、转换,载入)过程中,对新数据管道(data pipeline)进行设计、搭建与启动;
- 与机器学习工程师密切合作,为机器学习模型提供数据支持;
- 利用数据基础设施,分类解决数据基础设施问题。
资质要求
- 计算机科学及相关领域学士或硕士;
- 精通SQL(Spark,Hive等),精通实时数据处理;
- 精通维度数据建模和数据仓库schema设计;
- 精通定制或结构化ETL设计、实施与维护;
- 精通数据分析,确定可交付成果,发现差异与不一致情况;
- 了解Python;
- 对数据驱动观点的识别与沟通能力,良好的沟通技能。