岗位职责:1、参与数据平台的搭建、数据产品及、搜索、推荐等相关业务的研发、设计、主要定位为离线计算、实时计算、海量存储、Data Mining、等系统2、主要参与Hadoop、Mlib、Graphx等数据相关领域的研发、技术攻关任职资格:1、数学、统计学、计算机等专业本科以上背景2、算法和数据结构非常扎实,如bipartite graph、svm、 Bayes、mmseg、协同过滤等有实际应用经验3、擅长或热爱文本挖掘、语义分析、自然语言等领域4、3年以上JAVA/C++开发经验5、熟悉Hadoop、Spark相关开源项目,有Hive/HBase/Storm/Kafka/Redis/Solr/Lucene/Spark实际开发经验者 6、掌握MapReduce处理问题思想,熟悉分布式计算模型或有高效索引技术经验者优先7、熟悉Linux系统,对技术有浓厚的兴趣,喜欢阅读githup上的源码,有源码研究的兴趣8、软件基础理论知识扎实,具有良好的Java/C++基础、数据结构、算法功底比较好9、性格积极乐观,主动性和执行力强,有良好的沟通能力,抗压能力,有强烈的学习/技术研究能力和良好的团队精神10、开发并且开源过比较有影响力的项目或参加过kaggle优先