在利用机器学习来改进其商业模式方面,Facebook和Twitter已经让世界上大多数其他公司远远落后。虽然他们的做法并不总是能引起最终用户的最佳反应,但从这些公司那里可以学到很多关于在扩展和应用数据分析方面应该做什么以及不该做什么的东西。

首先获取您需要的数据

虽然 Facebook 似乎将机器学习用于所有内容 – 但它用于内容检测和内容完整性、情绪分析、语音识别和欺诈性帐户检测,以及面部识别、语言翻译和内容搜索功能等操作功能。Facebook 算法管理所有这些,同时将一些计算卸载到边缘设备,以减少延迟。

这使得拥有较旧移动设备(超过全球市场的一半)的用户能够更轻松地访问该平台。对于计算能力有限的传统系统来说,这是一个极好的策略,这些系统随后可以使用云来处理大量数据。基于云的系统还可以通过引入可访问的元数据来改进,这些元数据将自定义、更正和上下文化真实世界的数据。

首先考虑真正需要哪些数据,以及哪些数据集最重要。然后从小开始。很多时候,团队在急于做的时候会分心,做大做。但这种心态实际上可以混淆为真正的目标:做对了。专注于工作中的适度工作,然后增加应用程序开发以应用于更多数据集或更快地适应不断变化的参数。通过专注于早期成功和向上扩展,可以完全避免由于数据过快而导致的早期故障。即使真的发生了失败,小成功的势头将推动项目向前发展。

自动化培训

机器学习需要不断的修改和培训才能保持新鲜。Twitter 和 Facebook 都使用 Apache 气流自动培训,使平台不断更新,有时每小时循环一次。再培训的数量和速度将在很大程度上依赖于计算成本和资源的可用性。但是,理想的算法性能将依赖于数据集的定期训练。

最大的挑战之一可能是选择人工智能模型的学习类型。虽然深度学习方法是处理大型数据集的首选,但经典三训练可能会创建一个强大的基线,以优于深度学习,至少对于神经语言编程是这样。虽然三训不能完全自动化,但它可能通过采用不同的单元和民主共同学习产生更高质量的结果。

选择正确的平台

Twitter 和 Facebook 目前面临的挑战之一是试图标准化他们最初构建框架、管道和平台的非结构化方法

寻找一个可扩展的平台,并考虑公司的长期需求,以便成功选择正确的人工智能工具。

不要忘记最终用户

搜索”机器学习”和”Facebook”不可避免地会引发数百篇博文和文章,内容涉及一些用户对网站内置的人工智能功能的负面感受。隐私的丧失、数据挖掘和有针对性的广告是公司受到的一些不那么令人担忧的指控。然而,许多相同的用户欣赏其他AI工具,使他们能够连接到朋友和家人在其他国家谁不说他们的语言和工具,使平台没有色情和仇恨言论(如果有点不完美)。

不是技术本身,而是缺乏透明度,以及Facebook如何在其平台上实施机器学习,使用户感到沮丧,并使一些人反对。不要犯同样的错误。信任和透明度应该是所有重大决策的关键词。最终用户会欣赏它,他们会留下一个精心设计的网站,感觉他们从互动中获得了一些东西,而不是感觉个人被它侵犯。

Comments are closed.