关注 0 人关注

暂无介绍

14

数据科学家的高级进修:学会如何“讲故事”

8

关于Mapsidejoin最详细的应用介绍在这里

数据集干货:一文读懂Mapsidejoin
13

数据分析实践入门(一):数据预处理


作者|CDA数据分析师

从菜市场买来的菜,总有一些是坏掉的不太好的,所以把菜买回来之后要做一遍预处理,也就是把那些坏掉的不太好的部分扔掉。现实中大部分的数据都类似于菜市场的菜品,拿到手以后会有一些不好的数据,所以都要先做一次预处理。

常见的不规则数据主要有缺失数据、重复数据、异常数据几种,在开始正式的数据分析之前,我们需要先把这些不太规整的数据处理掉,做数据预处理。

一、缺失值处理

缺失值就是由某些原因导致部分数据是空的,对于为空的这部分数据我们一般是有两种处理方式的,一种是做删除处理,即把含有缺失值的数据删除;另一种是做填充处理,即把缺失的那部分数据用某个值代替。

1、缺失值查看

对缺失值进行处理,首先要把数据中的缺失值找出来,也就是查看数据中有哪些列有缺失值。

(1)、Excel实现

在Excel中我们选中一列没有缺失值的数据,看一下这一列数据共有多少个,然后把其他列的计数与这一列进行做对比,小于这一列数据个数的就代表该列数据有缺失值,差值就是缺失个数。

下图中非缺失值列的数据计数为5,性别这一列计数为4,这就表示性别这一列是有一个缺失值的。

11

数据分析师的核心竞争力在哪里?

12

案例解析|如何从运营的角度有效管理经销商?

案例解析|如何从运营的角度有效管理经销商?
17

机器学习的数据准备:为什么它如此重要,我们应该怎么做?


作者 | Nandhini TS

编译 | CDA数据分析师

Data Preparation for Machine learning : Why it’s important and how to do it

编码是成功的业务模型的前提。

建立成功的AI / ML模型3个方面算法,数据和计算。

虽然建立准确的算法和计算技能的应用是过程的一部分,但这是什么基础呢?

使用正确的数据奠定基础

从自动驾驶汽车等基于AI的大规模技术革命到构建非常简单的算法,您都需要正确格式的数据。实际上,特斯拉和福特一直在通过行车记录仪,传感器和倒车摄像头收集数据,并对其进行分析以制造出无人驾驶和全自动汽车,以确保安全的道路。

收集数据之后的下一步是准备数据的过程,这将成为本文的重点,并将在后续部分中详细讨论。在深入研究数据准备过程的概念之前,让我们首先了解其含义。作为基于AI创新的大脑的数据科学家,您需要了解数据准备的重要性,以实现模型所需的认知能力。

什么是数据准备?

数据是每个组织的宝贵资源。但是,如果我们不进一步分析该声明,它可能会否定自己。 企业将数据用于各种目的。从广义上讲,它用于制定明智的业务决策,执行成功的销售和营销活动等。但是,这些不能仅用原始数据来实现。

10

谁是冬日里的流量美食?用数据说话

谁是冬日里的流量美食?用数据说话
16

电子商务中的大数据分析——数据平台和人工智能


作者 | Ayn de Jesus

编译 | CDA数据分析师

数字原生电子商务企业习惯于帮助处理其客户提供的数据,以便为营销活动编写副本,运行PPC广告,计算客户生命周期价值以及基于CRM仪表板内的核心指标制定决策。他们了解数据获取收入和赢得市场利润份额的力量,甚至比银行业和保险业等较大的较老的行业还要多。

一些最大的在线零售商开展业务已有足够长的时间,足以拥有可以被人们准确称为“大”的数据,而这些电子商务企业也渴望将其大数据用于人工智能和机器学习等项目。就是说,在对零售,电子商务和市场营销专家的许多访谈过程中,以及我们对向电子商务公司提供产品的AI供应商的研究中,我们发现电子商务中的AI应用程序尚不完善,仍需不断的优化和改善以支持实际工作中的需求。

有许多AI供应商声称要向电子商务公司提供AI产品。通常,这些产品涉及预测分析和自然语言处理。这些供应商声称,他们的软件可以预测潜在的营销活动的成功,找到新的客户群,甚至可以自动在Google Ads上设置最佳出价,而无需营销人员的投入。不幸的是,这些以电子商务为主的AI供应商实际上常常对其AI产品的功能具有欺骗性。

他们倾向于聘用应届大学毕业生,并在LinkedIn上称他们为“数据科学家”,以填补自己的职位,似乎他们的团队由尖端的数据科学和AI人才组成,而实际上,甚至连他们的领导团队和最高管理层也没有具有人工智能的学术或商业背景,对于开发可在企业中出售的强大AI产品而言,这是必不可少的。

我们不会命名,但即使是一些知名度最高的“ AI”供应商,也用于营销和销售都在欺骗他们的专业知识。根据经验,在寻找能够解决其业务问题的AI解决方案时,企业领导者应谨慎行事,并且他们绝不应该出于自己的考虑将AI集成到其业务中。他们应始终评估AI是否适合解决其业务问题。

电子商务中的大数据分析——数据平台和人工智能


此时,电子商务领导者应着重于为机器学习解决方案在其领域中更远时准备其系统。为此,他们可以选择与销售数据管理系统的供应商签订合同,而该数据管理系统的构建可在需要时支持人工智能应用。这些供应商中的大多数声称为最终使用预测分析提供数据组织,其中一些供应商提供具有内置预测分析功能的平台,无论它们是名义上的。

在本文中,我们将介绍三个大数据平台和/或大数据分析供应商,这些供应商提供用于管理客户数据以及预测成功的营销活动和销售的软件,我们将从AbsolutData开始。

绝对数据

AbsolutData提供了一个具有内置预测分析功能的大数据平台,客户可以使用该功能来洞悉其客户的购物行为,提出产品建议,确定最佳产品价格以及创建购物车放弃流程。该公司声称其平台还具有推荐引擎方面,可以根据客户的位置向客户推荐产品。这些产品可能是根据过去在附近位置购买过的客户推荐的。

该平台还可以据称确定退货和换货对底线的影响,这可以为如何处理和提供给客户的决策提供依据。该平台背后的预测分析算法似乎也能够预测某些产品和某些类别的产品的需求。因此,电子商务品牌可以通过提前定购新库存来防止出现缺货情况。此外,该公司声称其平台可以优化在各种渠道的促销活动上花费的钱。也就是说,目前尚不清楚如何执行此操作,尤其是考虑到我们上面讨论的内容。当前,这是机器学习的困难且新生的用例。

总体而言,AbsolutData声称其软件能够进行各种基于大数据的分析过程,但该公司似乎没有关于其软件部分如何工作的演示。该公司仅将 Adidas,Dole,Epson,Etrade,Hershey's,Hyundai和Levi" alt="电子商务中的大数据分析——数据平台和人工智能" >

13

中金支付签约永洪科技,金融机构的数字运营之路

17

33 个神经网络「炼丹」技巧