数据分析近年来越来越火,其实学习SQL或PythonHadoopHivesparkFlink之类的只是操纵数据的工具,最终目的是希望量化业务,并帮助企业实现成长,所以多和产品市场的同学交流业务是很有必要的,只关注于具体做什么是没有必要的。接下来就由小编为您介绍大数据和数据分析,数据分析是做什么的。
大数据和数据分析
通常称为“运行数据”。leader需要季度/月/周的一组数据,写出一段或N段SQL来运行数据。通常是临时的需求,但是当发现悄悄演变为常规需求时,最好将SP(存储过程)直接封装起来……每一次运行都很方便省事。这一工作内容需要以下技能要点:数据库,SQL
这是一个耗时和麻烦的部分。先期的工作是基础数据的处理清洗,基础汇总聚合,然后设计监测指标,指标设计不仅仅是数学分析,更需要跑业务需求方去了解,毕竟最终目的是要让别人用,提升效率,不是为了凸显模型高估。有了所有所需的数据之后,就开始建立商业模型(数学模型),整个建模过程也是对数据反复探索的过程,在一定数据量的情况下,初始建模应用起来一定会出现那种问题balabala烦死人…以后调整优化的过程。技术要点:SQL,excel,R语言,数理统计,数据挖掘,商业知识。
完成商业模式之后,得到指标结果。将资料放入数据库。下一步需要去寻找开发帮助您创建可视化站点。身为数据分析员我最了解这个项目逻辑流程,核心算法,业务应用。寻找开发帮助您制作可视化站点:曲线图啊柱状图啊饼图啊,balabala让别人一眼就可以看到指标的总体状况。技能点:逻辑思考、过程规划、数据可视化、一定的开发知识(便利和发展交流)、表达能力和表达能力。
收集业务部门的反馈,不断与他们进行邮件沟通,不断优化模型、数据表。并向业务部提供某些特殊需要的分析评估报告(临时需求)。技巧点:逻辑思考、表达能力。(5)个人学习:有时会遇到等候别人工作进度的情况,比如别人的上一批数据没有出来,你根本就无能为力。那么你可以上网或者读书来获取知识。数据统计和数据挖掘博大精深,如何能很好的应用,产生最高性价比更是一门学问啦。更多的理解并没有什么坏处。
与大数据相关的“大数据”已不再是个人工作的内容,而是一个整体的工作内容。特别是要让那些了解hadoop和spark的人负责在上面运行数据,并编写最终的实现代码。在我们的团队中,大概有数据分析师、数据工程师(半个产品经理),有三人兼三人,有人只爱专精。技能点:没有特定的法则,团队协作加分。
其实我们国家目前还没有真正数据科学家,这个职位在国内被炒得太稀有了:既会线性代数统计,又会数据挖掘,玩得了R和SAS模型,写的是Javapythonscala,当得了SQL型数据库DBA,又能玩NoSQLhadoopspark,懂业务,懂技术,善沟通,有商业头脑等,踏实做好数据分析就不错了,以上就是小编为您介绍的大数据和数据分析,数据分析是做什么的。
[免责声明]
文章标题: 大数据和数据分析,数据分析是做什么的
文章内容为网站编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请及时沟通。发送邮件至36dianping@36kr.com,我们会在3个工作日内处理。