简介:摘要:随着国民生活水平的不断提高,人们更加注重精神层面的追求,观影成为相当一部分民众的选择。本次研究就是根据已知性别用户的观影习惯,将其与未知性别用户的观影习惯做对比,以此分析未知用户的性别,从而为之后的用户提供更好的观影体验。本文的数据来源是通过人邮社区服务与资源下载社区获取,实验环境使用了4台PC搭建虚拟机Hadoop集群。集群搭建完成之后,即可实现数据的上传下载,网页端对集群信息的访问。之后对数据进行预处理,利用MapReduce函数对数据进行编程实现并分析出结论,该结论对于电影网站用户性别预测具有明确的指导意义。