6

机器学习 + 全球数据库,一攻一守读取全球化未来

 4 years ago
source link: https://www.infoq.cn/article/Pwt9v37wCHzTNvbMGQpT
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

在我们生活的周边,无论是餐饮、娱乐、制造亦或是更高端的科研领域,跨国企业正在变得越来越多。与之相对应的,发展跨国业务势必将面临业务规模和用户量爆发式增长,这时,IT 系统架构需要持续迭代升级,自动化技术如机器学习等地位越发突出,数据库全球化需求也在不断增强。

用户量激增是一个值得两面看待的事情。一方面,新用户的增加必然会带来更多的营收点;另一方面,大量用户的涌入,也会增加用户数据的处理难度,同时也会对产品模式及系统框架造成新的冲击。面临大量用户的涌入,如何更好地处理用户数据,将会对产品的改进有着重要意义。这其中,很多企业选择了机器学习的方式来进行处理,其高效、可靠的运行方式和处理效率,可以对企业提供有效的帮助。

系统升级中容器化是一条必经之路,而 Kubernetes 可以让容器化之路走得更快更稳。可问题在于,从数据流到机器学习训练的过程十分繁杂,如何让容器保持高效运转、让 Kubernetes 和机器学习的使用更加便捷呢?Kubeflow 是个不错的选择。作为一种前沿的开源技术,Kubeflow 可以在 Kubernetes 上运行机器学习工作负载,基于 Kubernetes 去方便地维护 ML Infra。并且,Kubeflow 能够充分利用 Kubernetes 提供的扩展性和调度能力,对大规模分布式训练和自动机器学习相对拥有优势。

如果 Kubeflow 是全球化发展过程中的一柄长矛,那么全球数据库解决方案便是护体的坚盾。

新的业务,还意味着新的风险,用户人数越多,被攻击的风险也就越高。近期来看,从国内的新浪微博,到国外的 Facebook,这些拥有上亿用户数据的巨头也绕不过数据泄露这一问题,更不用提之前发生的删库跑路事件,全球化过程中如何保护好数据库,已经是一个刻不容缓的问题。

如何解决才好呢?方法很多,但万变不离其宗。一方面,构建全球业务一体化架构,打造跨区域容灾能够解决多地的协同难题;另一方面,提供低延时的跨区域数据复制和灾难恢复能力,能够帮助整体业务不会被意外问题所影响,可以同时保障业务流畅与安全。

那么,无论是 Kubeflow 还是全球数据库解决方案,这两种技术在国内各自不同的企业环境中该如何落地?4 月 14 日、4 月 21 日,AWS 两场在线研讨会上,技术专家将通过在线课程讲解,免费为广大开发者献上 AWS 的先进技术落地经验。

课程安排

主题:在 AWS 上构建基于 Kubernetes 的机器学习平台

直播时间:4 月 14 日 14:00-15:30

讲师介绍:王宇博 AWS Senior Developer Advocate

主题介绍:Amazon EKS 使得在 AWS 上进行 Kubernetes 部署、管理和扩展容器化应用程序更加简便。Kubeflow 是以简单、可移植和可伸缩的方式在 Kubenetes 集群上运行机器学习任务的工具集。本次在线研讨会将介绍 Kubeflow 机器学习工具集,如何在 Amazon EKS 上构建 Kubeflow 机器学习平台以进行机器学习的训练和推理,以及 Amazon EKS 与托管机器学习服务 Amazon SageMaker 的集成使用。

重点内容:

1、基于 Docker 和 Kubernetes 的机器学习

2、Kubeflow 概览

3、Kubeflow 功能

4、在 Amazon EKS 上部署 Kubeflow

适合人群:机器学习从业者;数据工程师;对机器学习感兴趣的人员

主题:天涯若比邻 - AWS 全球数据库解决方案

直播时间:4 月 21 日 14:00-15:30

yiaMFjY.png!web

讲师介绍:吕琳 AWS 数据库专家架构师

主题介绍:快速、稳定、安全、易用的跨区域数据复制技术是构建全球业务一体化架构和跨区域容灾的关键。AWS 全球数据库解决方案“三剑客” :Amazon Aurora 全球数据库、DynamoDB 全局表、和 ElastiCache for Redis 全球数据存储, 专为全球分布式应用系统而设计,提供了低延时的跨区域数据复制和灾难恢复能力。

重点内容:

1、Amazon Aurora 全球数据库:跨区域数据复制延迟通常不超过 1 秒,跨区域数据库故障切换通常不到 1 分钟

2、Amazon DynamoDB 全局表:多区域、多主数据库

3、Amazon ElastiCache for Redis 全球数据存储

4、演示及案例介绍

适合人群:技术经理、架构师、DBA

报名方式

AWS 在线研讨会是常年举办的系列线上技术课程,话题涵盖:快速上手实操、前沿技术话题、行业技术应用、核心服务详解、培训与认证等。想要参与的小伙伴请点击「阅读原文」或扫描下方二维码报名参加,精彩技术内容,坐等你来互动参与哦!

MZ3E3aN.png!web

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK