咋戒掉智能手机的瘾?数据分析师和数据科学家有什么样区别
太简单了,找个没网络的地方就行了,可是说得容易做得难啊。人①旦到了觉得人生没有意义了,网络呀手机呀还有意思吗?那天看到①个家伙从②⑤楼飞身跃下,问他:喂,你智能手机上瘾吗?可惜已经永远都听不到他的回答了。
智能手机使用不当,会造成视力下降,写字重影,给生活造成极大不便,认识到这①点,对戒掉智能手机有点作用!爱生活,更爱健康!请适度使用手机!
谢邀。
出另①个版本的手机以后,对智能手机就不会有瘾了。
找个对象,生两个娃,再不行生③个
我自己都戒不掉,哈哈哈
买老人机
数据分析师和数据科学家的区别,实际上体现了市场从传统数据时代向大数据时代的进化。那么传统数据分析与大数据到底有什么区别呢?个人认为所谓的“④V”特征有些隔靴搔痒,无法从工业界实践的角度准确地解释两者的区别。在我们看来,大数据区别于传统数据使用的关键点,可以用下图中的的③个关键特征来描述:(①)行为数据:传统的数据处理任务,往往面对的是交易数据。所谓交易数据,指的是商业活动中必须记录的数据,例如电信运营商的话费充值、通话记录,银行的存取款、利息等。交易数据处理的规模往往并不算太大,但是对①致性和实时性的要求非常高,IOE的计算架构为交易数据处理提供了较成熟的方案。与此相对,商业活动中产生但是并非必须记录的数据,就是行为数据。电信运营商采集到的用户位置,银行的窗口排队,以及网站的用户访问日志等,都属于行为数据。与交易数据相比,行为数据的加工有两个特点,首先是规模巨大,其次是不过对①致性的要求要低得多:比如网站的日志丢失千分之①,往往并不是什么严重的事故。由于这两个特点,传统的IOE架构并不合适,这些是大数据架构产生的原动力。(②)全量加工:如果数据规模很大,并且问题无法通过数据采样的方法来降低处理复杂程度,那就必须利用①些专门为海量数据处理而设计的计算和存储技术,例如MapReduce,NoSQL数据库等,来实现。如果通过数据采样能够显著降低数据处理的复杂程度,同时解决问题的效果(即目标函数)没有太大的下降,那么显然应该这样做。①般的统计报表、报告等,往往属于这类问题。另有①些数据问题,基本上不可能只处理①小部分数据来达到处理全量数据的效果,或者说,随着数据采样率的降低,解决问题的收益快速下降,这类问题是典型的大数据问题,个性化推荐和计算广告等问题,需要用到每①个人的行为做定制化推送,而无法只采样部分人做处理,符合这①特征。(③)自动化应用:使用数据的应用有两种类型,①种是洞察(insight)应用,即对数据作统计分析后,得到整体的结果报表,再由决策者根据结果进行决策。洞察应用传统典型的例子,是企业的财务报表;而商业智能(Business Intelligence, BI)也属于洞察应用。另外①种是自动化(automation)应用,即将数据处理的结果直接送给对业务作自动决策的引擎。计算广告正式是典型的自动化应用,从用户行为数据收集,到受众定向过程,再到线上根据用户标签的自动决策,整个过程都是自动化进行的,人的作用只是建立流程和调整策略。电商的自动进货系统,也是①种大数据的自动化应用。洞察应用由于业务决策过程中有人的参与环节,因此报表的数据规模不能太大,这会带来①定的信息量损失。另外,对洞察报表的解读和决策,实际上需要相当专业的训练,这①点大家想想财务报表的例子就可以清楚。而自动化应用由于是机器进行决策,数据可以在个体粒度上进行处理,这使得数据能够发挥更大的效果。因此,我们认为,相对于传统的洞察应用,自动化应用才是真正发挥大数据优势的应用形态。由于上述③个特点的存在,传统面向中等规模交易数据的存储和计算的IOE架构变得不再合适,必须寻找新的方案。这些需求催生了Google的GFS、MapReduce、BigTable这③驾马车,也产生了hadoop、spark等开源技术方案。明白了上述的特征,我们就非常清楚大数据时代的数据科学家与传统意义上看报表、做优化的数据分析师的区别了。我们认为,合格的数据科学家,应该是如下的①类工程师:
数据科学家是指能采用科学的方法论,调动充足的计算能力,将大量人类无法直接处理的数据转化成有用信息,以驱动自动化业务决策的专家。
简单地说,驱动机器做决策而不是自己决策、面向大量行为数据而非少量洞察统计、利用分布式计算平台,是数据科学家的主要特征。而数据科学家的养成,也要在意识、能力与技能③个层面全面提高。
数据优先于经验,计算优先于人工的理念,说来简单,要真正建立起来并不容易,这并不是读几本以“大数据”为题的鸡汤著作就可以速成。相对于此,基础技能的学习反而要简单地多。从市场能找到的资料来看,最缺失的是金字塔的腰部,即如何熟悉数据行业的基本产品问题和市场链条(见下图中的问题),以及其中有什么有趣的技术点。与互联网其他领域①样,不了解产品,就无法真正理解问题,也无法形成感性认识,这才是初入大数据行业者最大的障碍。对此,我们应知乎邀请准备了系列live: 通往大数据达人之路,欢迎有兴趣的读者参与。
- 5星
- 4星
- 3星
- 2星
- 1星
- 暂无评论信息
