准确的电话号码和 WhatsApp 号码提供商。 如果您想要电子邮件营销活动列表或短信营销活动,那么您可以联系我们的团队。

Whatsapp: +639858085805      电报: @xhie1

营销中的机器学习

机器学习使计算机无需人工干预或明确的编程指令即可发现数据中的潜在模式。

对于简单的任务,程序员可以编写代码,然后计算机执行程序规定的任务。对于复杂的任务和大型数据集,可以让机器自己开发问题的解决方案,而人类则无法编写出处理任务可能需要的所有可能场景的详细程度。机器学习模型利用计算能力来实时处理大量数据集,从而产生有时超出人类能力的分析。

 

机器学习简史早期机器学习

使用 Russian Data 的 WhatsApp 号码数据最大化您的营销推广。我们广泛的数据库提供经过验证的 WhatsApp 号码,可实 手机号码数据 现有针对性的沟通和互动。直接与潜在客户联系,并通过个性化消息传递提升您的销售策略。立即使用 Russian Data 探索 WhatsApp 营销的强大功能!

机器学习起源于 20 世纪 50 年代,当时它属于人工智能 (AI) 的一部分,人们对能够从数据中学习的机器产生了兴趣,最初只是使用一些简单的算法。20 世纪 60 年代和 70 年代,人们的兴趣仍在继续,工作重点是模式分类。几十年来,机器学习偏离了经典人工智能的目标,即机器至少可以模仿人类智能。相反,到了 20 世纪 90 年代,机器学习作为一种用数据驱动的方法解决实际问题的方式而广受欢迎。随着机器学习开始被视为一个独立的研究领域,人们开发出了更先进的算法,个人电脑成为现实,机器学习的商业化开始出现在游戏、商业和功能应用中。

 

为什么是现在?

手机号码数据

2012 年至 2017 年的 5 年间,机器学习工作增长了 10 倍,数据科学在同一时期增长了一半以上。在过去十年中,可用的数据量呈指数级增长,目前每天的数据输出量估计接近 3 千万亿字节。作为参考,1 千万亿字节约为 1 艾字节(exa = 乘以 1000^6),约为 250,000 亿 页文本。

即使只有一小部分数据是可访问的或可能有用的,但如此庞大的数据量也需要最强大、最高效的工具集来分析。与此同时,数据驱动的决策成为首选逻辑,因为基于准确信息和预测的决策所带来的经济收益是竞争企业使用其所能使用的最高效工具的强大动力。

幸运的是,随着数据速度、种类和数量(3V)的激增,有助于促进其发展的基础设施也可用于分析数据:高速互联网和网络分布、廉价可靠的存储以及计算机处理能力。虽然传统分析被广泛使用,但事实证明,机器学习非常适合解决大数据固有的规模、复杂性和模糊性。

 

什么是机器学习?

 

概念

与其他分析工具一样,机器学习用于将数据转化为知识。但是,机器学习并非通过纯粹的处理能力搜索大量数据以发现模式和数据组合中揭示的洞察力,而是不仅寻找模式,还旨在识别似乎控制数据的规则,将学习应用于查询,并提供可应用于其他数据集的模型。为了识别这些规则,机器学习模型中的算法必须  从输入及其统计分布中 学习。因此,该工具集被称为机器学习。在此学习过程中,算法通过代表实际问题的数学表达式进行学习,提炼知识并学习在特定条件下会产生什么样的输出。通过对越来越大的数据集进行重复,机器学习算法能够为新输入定义输出,为新数据创建正确答案——以及分析师无法独自获得的可用信息和洞察力。

 

机器学习如何工作?

正如人们所料,涉及大量数据集的分析过程始于收集和准备数据,并以某种形式的评估结束。机器学习过程遵循此分析模型,但有几个关键区别。

  1. 数据收集:识别并收集算法需要学习和评估的所有数据。请记住:大多数算法都需要大量数据才能准确运行并提高泛化能力。
  2. 数据准备:清理、组织并将数据格式化为可访问的形式,执行特征选择、特征工程等。不良数据(标记错误、格式不一致、结构化字段中的非结构化数据等)、缺失数据和不明确的特征都会影响算法性能。
  3. 训练:将公开监督学习的训练数据集,以便算法学习将输入映射到输出的底层规则。
  4. 测试:针对保留数据集对模型进行测试,以衡量其性能和学习效果。注意:在许多情况下,机器学习工程师会尝试多种算法,彻底优化并测试每种算法以确定哪种算法表现最佳(模型选择)。使用多种方法来达到最佳结果并不罕见。
  5. 生产:模型投入生产后进行测试和进一步调整。

上述流程步骤仅限于为一般 ML 项目准备 ML 模型所需的步骤。实际的 ML 项目从问题识别开始,将问题与潜在的 ML 解决方案进行匹配,最后为目标数据集部署和监控模型。

 

机器学习的类型

根据学习方法,机器学习可以分为不同的形式:监督学习、无监督学习、半监督学习和强化学习。

 

监督机器学习

在监督式机器学习中,目标是学习定义输入和输出之间关系的规则。训练数据集包含带标签的输出,以便模型学习两者之间的关系。学习后,模型可以接受新的输入,并根据学到的规则计算输出。

监督学习使用输入和输出的训练数据根据新输入预测输出。

无监督机器学习

在无监督机器学习中,算法仅提供输入数据,没有标记的输出数据来与输入进行比较。正如人们所预料的那样,当期望值定义得不那么明确时,无监督学习在探索性分析中表现出色。示例模型包括聚类(创建相似特征和属性的组)和降维(删除数据列和无用特征)。

无监督学习分析数据特征并利用这些特征创建具有相似属性的项目聚类。

 

半监督机器学习

顾名思义,半监督 ML 是上述两种方法的混合,其中只有部分数据包含输出。由于监督 ML 的挑战之一是收集所需的大量标记输入/输出训练数据,因此这种混合方法允许使用较少的标记数据集与较大的未标记数据集进行分析和学习。

 

强化学习

强化学习不太常见,而且比上述模型组更新颖,它使用奖励而不是标签进行学习。强化学习中的算法在分析和学习数据时会增加奖励。给定一个具有明确奖励的复杂数据集,算法会进行优化以增加奖励,从而学习提供基于奖励的结果的最佳计算。

请注意,虽然这些“学习类型”类别中的每一种学习和解决问题的方法都不同,或者至少在某种程度上不同,但它们都遵循一个核心过程理论:使用数学计算模型在大量数据中寻找模式、规则和见解,随后由实践者用它们来帮助解决问题。

 

机器学习的优点和缺点

 

优点

ML 的一个显著特点是能够快速准确地处理大量多样化的数据。随着目标数据量不断增长,应用的 ML 可以扩展而不会降低性能。数据可能极其异构,混合了结构化/非结构化数据、多种类型(图像、文本、财务、语音)以及跨数据特征具有复杂关系的多维数据。速度和准确性在规模上优于非 ML 分析解决方案。

随着数据的变化,机器学习无需人工干预即可适应变化。最常引用的例子包括天气预报和计算机病毒检测——在这两种情况下,机器学习都会适应计算新天气指标组合的准确输出,并能够在技术生态系统中出现新病毒时识别它们。自主适应变化在一定程度上是自动化的一个子集,而自动化本身是机器学习的一个宝贵特性。

由于机器学习能够识别出没有辅助的分析师永远无法观察到的趋势、模式和见解,因此与无辅助分析相比,机器学习的性能提升几乎是不可估量的。机器学习能够应用于广泛的领域,其价值已在一系列不断扩大的性能指标中得到证实,包括评估信用风险、标记欺诈性转换、自主机器人、调试复杂的计算机科学程序,以及许多其他失败代价高昂或危险的领域。最后,随着机器学习模型在更多数据上不断迭代,模型的性能将有效提高其预测能力。

 

缺点

讽刺的是,机器学习的主要优势之一也可能是其劣势——在某些应用中需要大量数据集。由于机器学习需要大量可用质量的数据集来训练模型,因此访问此类数据集可能成为行业或特定领域层面的障碍。法律、隐私甚至专有知识都可能阻碍收集适当的数据。

涉及多种技术和内容领域的大型复杂分析项目会增加出错的几率。经验不足的从业者决定在内部开展机器学习,他们可能会发现,基于一些基本因素(例如准备不当的数据训练集或误解算法的输出)的预 不要再浪费你的预算在弱信息传递上 测很容易出现巨大错误。许多机器学习项目都是大型计划,涉及业务中的多个控制领域(甚至业务之外)。不同地点、不同所有者和利益相关者的多个大型数据集的复杂性可能很难驾驭,尤其是对于长期项目而言。

 

应用机器学习

机器学习问题组

在机器学习中,模型是一种针对特定问题类型应用和训练的算法。当应用于特定数据集时,它会进一步学习,以了解独特的模式和规则,帮助从业者改进和提供解决方案。

 

分类

分类问题通常使用监督学习来预测类别值,例如,客户属于“高价值”类别还是“低价值”类别。虽然输出可以是二进制的,但分类可以包含多个类别。最简单的分类模型预测两个类别中的一个、两个或多个类别中的一个,而在高级算法中,则从更多类别中预测多个类别。虽然在最简单的层面上,模型将确定客户是属于高价值细分市场还是低价值细分市场,但分类实际上可以划分出多个细分市场中的客户。正如预期的那样,像逻辑回归这样看似简单的模型可以解决许多分类问题:基于对标记输入和输出的训练,逻辑回归算法将为客户分配 0 到 1 之间的概率,其中 1 表示绝对高价值,0 表示绝对低价值客户。对于非二进制分类,客户(或另一个分类对象)被归类为属于大量类别之一,需要一种非线性算法来预测这些类别之间的概率分布。

 

回归

回归模型是一种监督学习方法,它根据给定的独立值预测数值依赖值。简而言之,它找到输入和输出之间的关系并将其计算为数值。

 

聚类

聚类是一种常用的无监督模型,其简单目标是根据相似特征对示例进行分组或聚类。由于没有带标签的输出数据进行训练,聚类算法通常使用分组来代替。这种自动分组会反复重新计算,以优化不断增加的聚类数量。例如,K-Means 算法会在数据中随机创建“K 个中心”,然后将其他数据点分配给最近的中心,然后重新计算每个聚类的中心。这个过程一直持续到中心不再变化(或变化很小)。此时,这个过程就完成了。聚类是一种有效的方法,常用于客户细分。

 

降维

监督和非监督算法模型均可用于降维,也称为维度减少,即从数据集中删除最不重要的信息(或 维度)的过程。在数字图像分析等极大数据集中,可能涉及数百万像素。删除对图像分析最不重要的像素会将数量减少到不太笨重的数据集。同样,在博客、社交媒体和客户服务互动等客户通信等大规模营销数据集中,从各种数据源捕获的许多维度可能与研究问题没有多大关系。但是,模型中包含的维度或特征越多,准确性所需的数据量就越大。因此,分析师和研究人员在开始有针对性的 ML 辅助分析之前,会尝试使用降维过程来限制这些不重要的特征。幸运的是,在使用主成分分析 (PCA) 等算法时,分析师可以衡量由于降维而丢失了多少信息,并在继续之前进行调整。

 

自然语言处理

自然语言处理 (NLP) 与其说是一种 ML 算法,不如说是一种跨越语言学、计算机科学和人工智能界限的技术。在 ML 的背景下,NLP 被用作 ML 辅助问题解决的先行手段,通过为 ML 任务准备数据集(文本或语音)。

由于绝大多数数据都是人类语言,因此 NLP 的价值在于使这些数据集在计算机支持的环境中变得可理解且有价值。如下文“营销应用程序”中所述,ML 模型可以使用 NLP 处理的文本来检查大量客户生成的数据,以识别社交媒体提要、帖子和产品网站、博客、客户服务论坛/聊天等上的互动中的模式和规则。无论是使用 ML-NLP 模型进行情绪分析以告知客户和产品协调,还是揭示客户流失(客户流失率)逆转倾向的未知指标,熟悉该工具集的分析师都可以使用 ML 模型在现在可访问的所有形式的人类语言数据集上发现巨大的价值。

 

机器学习驱动营销

以下是应用于营销相关领域的一些流行模型。由于模型及其组成的算法与主题无关,因此相同的模型和算法通常用于完全不同且通常相邻的领域。虽然以下应用程序的主要目标重点可能在一个领域,但大多数 ML 在营销中的应用都跨越了主题界限,这仅仅基于组织的重点。例如,许多 ML 营销应用程序可以称为个性化(每个应用程序都针对不同的目的进行个性化)。同样,许多应用程序可以归结为客户参与;然而,在下面的例子中,最明显的营销目标差异化因素用于说明 ML 可以应用于影响绩效并最终影响收入的不同方式。

个性化 

人们可能会认为 Netflix 是推荐引擎的典型代表 。尽管 Netflix 一开始确实是从推荐电影和电视节目开始的,但它很快就开始对整个系统进行个性化。为了增加每个订阅者的屏幕时间并确保新加入的内容获得点击,Netflix 使用多臂老虎机方法来确定每部新原创电影或剧集的最佳视觉效果。然而,他们随后决定为每位 客户提供定制视觉效果,以便产品的个性化包含尝试新产品的诱惑。Netflix 使用 ML 算法来个性化查看者主页上产品行的结构、使用哪些图形以及呈现的信息。现在,Netflix 的工程师正在寻求识别 允许更大程度的定制和更准确推荐的上下文变量 。对于 Netflix 来说,个性化意味着更多的屏幕时间,这意味着续订订阅和收入。

 

机器学习驱动的细分

对客户进行细分是实现产品、服务和消息传递个性化的核心第一步。开放数据集以包括潜在客户和客户会很快产生大量数据,需要根据一系列指标进行分类,其中许多指标仍是未知的。使用无监督机器学习模型(例如聚类(例如 K-means 算法)),从业者可以分析查询、社交媒体互动、产品网站接触点等中发现的数十亿个客户兴趣变量。结果将是基于超出最佳、无人协助的分析师能力的洞察力的客户细分。机器学习驱动的细分可以识别最有利可图的细分市场、最有可能流失的客户、与不同细分市场相匹配的产品,甚至新产品需求。

请记住,最有利可图的客户细分是基于终身价值 (LTV),而不是首次购买,甚至不是迄今为止的购买。机器学习可以使用监督学习算法(从历史数据中学习并预测未来输出)比传统数据分析更准确、更快速地预测 LTV。基于 LTV 的细分是众多示例之一,其中需要结合多种算法甚至模型类型来从复杂数据集中提取见解。

 

预测客户行为

自从 20 世纪 40 年代政府开始试验早期计算机以来,预测分析就一直是一种强大的工具,而另一些人则推测它至少可以追溯到 17 世纪,当时伦敦劳合社需要对保险业务至关重要的未来估计。在营销中,一个高价值预测因素是客户流失。由于很大一部分收入来自回头客,因此提前预测和解决客户流失是一个重要的收入驱动因素。使用机器学习算法识别特定时间段内最有可能流失的客户,企业可以通过消息传递、激励措施和针对风险客户的有针对性优惠进行干预。虽然传统分析可以将客户细分为不活跃期,但机器学习可以发现和量化客户流失前的许多变量和行为信号,并可以对风险级别进行分类,以确定优先采取行动。

由于许多众所周知的流失倾向指标都是滞后指标,因此大部分损失已经造成,当发现时客户几乎已经流失。因此,机器学习的挑战不仅是识别可能流失的客户,还要尽早识别异常行为指标。第一个任务最好用分类模型(流失率 = 1 或 0)来解决,但第二个任务需要异常检测。异常检测需要识别相关的异常值,可以用无监督异常检测模型来解决。

 

内容创建和优化

具体来说,AI 和 ML 能够在内容周期的多个点影响内容开发和交付。根据客户群体评估新的研究主题,优化现有内容以提高搜索引擎性能和客户一致性,甚至确定优先内容差距。

例如,  OpenAI 的 语言生成器 GPT-3 可以根据结构化数据自动创建更短的内容片段,自动开发产品描述、推文、客户营销电子邮件、简短新闻报道,所有这些都可以在不到一秒的时间内完成。

 

使用 NLP 生成见解

如上文所述,NLP 是一个跨越语言学、计算机科学和人工智能界限的子领域。NLP 技术可用于解析基于语言的内容(无论是基于语音还是文本),并创建可用的数据集,然后可根据情绪等多种变量对其进行解析,从而提供关于客户对产品的反馈、相关趋势和可衡量的客户流失风险的宝贵见解。这些基于数据的见解嵌入在数千条客户帖子和跨多个渠道的互动中,同样可以带来产品改进、客户流失减少、新(客户期望的)产品和服务,并最终实现转化。

可以采用相同的方法评估所有新闻来源,从类似的变量中获得见解,从在线新闻来源和涉及相关行业和特定业务的博客中收集可操作的知识。

 

客户参与

目前最流行的机器学习应用之一是使用聊天机器人来改善客户服务 – 消除等待时间、始终“在线”、连接到最新的产品信息和帮助台答案 – 同时通过捕获查询、响应和线程在产品和客户级别构建不断扩展的数据集。

虽然许多客户服务机器人更多的是脚本化的,而不是人工智能的,但那些使用 NLP 和 ML 的机器人能够提供高级功能,以媲美实时聊天的客户体验。支持 ML 的聊天机器人可以随着处理更多问题而适应,连接到与主题相关的所有在线资源,并能够在必要时捕获并升级到实时客户服务代表。

 

营销自动化

20 世纪 90 年代,营销自动化平台开始腾飞,它首先利用了 CRM 和电子邮件营销程序中涌现的一系列技术进步。关键功 BM 列表 能是自动执行重复且相对简单的任务,很快又增加了其他更复杂的任务——由机器学习驱动的任务。自动化平台使用机器学习处理大量捕获的客户数据,开始通过自动化潜在客户评分和整个客户旅程中的个性化客户开发为智能决策提供支持。从捕获的交互数据中提取的见解可用于在每个点动态地为每个人提供准确的消息,将潜在客户转变为终身拥护者。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注