岗位职责:1、高并发、大数据搜索引擎系统开发;2、研究分布式信息检索的服务架构,分析和修改相关性算法、策略,构建高性能,灵活易调研的分布式检索系统;3、参与分布式爬虫系统的研发,设计爬取、调度和抽取算法,优化系统;岗位要求:1、三年以上Java、Python开发经验,熟悉网络爬虫原理,有网页抓取、网页信息抽取、网页结构分析工作经验;2、深入理解分布式检索和实时索引,熟悉中文分词、排序和自然语言处理等相关技术;3、熟练使用并深入理解Lucene/Solr/ElasticSearch等搜索引擎工具;4、熟练掌握并深入理解一种或两种NoSql数据库,如MongoDb、HBase、MemcacheDb,有海量数据挖掘经验者优先考虑;5、有良好的沟通、理解能力,逻辑思维能力强,并且能够独立思考虑以及解决问题。