大数据+AI 2020 北京站-云视频-阿里云开发者社区

始于开源，精于实践，作为2020年收官之战，本次 Meetup 又将让大数据和 AI 擦出怎样的技术花火？开源届冉冉升起的新星和风光无限的老将们将会用哪些精彩案例作为年度收尾？来自阿里云、滴滴出行、微博、Databricks、汇量科技、 Zilliz 等知名企业的技术大咖将以实践案例深度解读大数据+AI的现在与未来。落地到出行、应用于医疗、服务在社交媒体，我们从声音、影像、图片、数字···交织的信息巨网中撕出一道道出口，透出属于大数据人的科技之光。
告别2020，圣诞前夕，12月19日上午10:00，和我们相约北京站吧！抢限量120张现场免费门票，速来报名吧～到场还有机会可得专业大数据赠书、天池赠书以及其他精美社区礼物！
届时，本次活动也将通过线上直播的方式全程同步播出，无法亲临现场的同学可在活动当天点击进入直播间观看活动！

【议题详情】

1、《 NLP 在医学领域的应用》

议题简介：

介绍医疗NLP技术的特点、难点以及阿里算法团队的实践经验，以及阿里巴巴医疗NLP算法中台的建设和在智慧医疗项目中应用。

嘉宾简介：

陈漠沙，阿里云达摩院高级算法专家

2、《 Hive SQL 到 Spark SQL 在滴滴的实践》

议题简介：

滴滴 Hive SQL 到 Spark SQL 背景介绍, 迁移方案, 当前进展和结果

嘉宾简介：

杨建丹，滴滴出行大数据架构部专家工程师。
负责滴滴 Hive 服务, 离线Yarn调度以及 Spark 服务, 在Yarn, HDFS 和 Hive 上有多年实践经验。

3、《深度解析 Delta Lake Trasaction Log》

议题简介：

Trasaction Log是理解Delta Lake的关键，它为大多数关键功能提供支持，如ACID事务性，元数据管理，time travel等等。本次分享我们详细介绍trasaction的概念、原理以及其如何解决多路并发读写问题。

嘉宾简介：

李元健，?Databricks 软件工程师。
曾于2011年加入百度基础架构部，先后参与百度自研流式计算、分布式Tracing及批量计算系统的研发工作，2017年转岗项目经理，负责百度分布式计算平台研发工作。2019年加入 Databricks Spark 团队，参与开源软件及 Databricks 产品研发。

4、《Fluid - 云原生环境下以应用为中心的数据集管理平台》

议题简介：

得益于容器化带来的高效部署、敏捷迭代，以及云计算在资源成本和弹性扩展方面的天然优势，以 Kubernetes 为代表的云原生编排框架吸引着越来越多的 AI 与大数据应用在其上部署和运行。但是在计算存储分离的大背景下，AI和大数据云原生应用的数据访问性能，效率和成本都受到了巨大的挑战，为系统化解决相关问题，Fluid提供了数据应用协同编排、智能感知、联合优化等一系列能力，并且形成一套云原生场景下数据密集型应用的高效支撑平台。本次演讲中，我们将分享开发Fluid的初衷，设计以及现有的功能演示。

嘉宾简介：

车漾，阿里云智能高级技术专家。
从事 Kubernetes 和容器相关产品的开发。尤其关注利用云原生技术构建机器学习平台系统，是 GPU 共享调度的主要作者和维护者。

5、《Milvus 在图片检索场景的最佳实践》

议题简介：

图片搜索的典型应用场景
Milvus 开源向量搜索引擎简介
如何使用 Milvus 实现以图搜图
深度案例介绍

嘉宾简介：

李云梅， Zilliz 数据工程师/Developer Advocate。
毕业于华中科技大学计算机专业。熟悉视觉和自然语言两个领域的各种经典 AI 模型。自加入 Zilliz 以来，致力于为开源项目 Milvus 探索解决方案，帮助用户将 Milvus 应用在实际场景中。

6、《汇量科技在 Spark 上构建推荐算法 Pipeline 的实践》

议题简介：

在推荐系统中，数据、特征工程和 AI 算法具有同等重要的地位。汇量科技的MindAlpha 平台，探索了深度学习框架与 Spark 深度结合方案，使得数据处理和算法模型训练能够在同一套框架中执行，构建了完整的算法开发流程，提升了算法实验的开发效率。本次分享将将重点介绍整体的架构设计和实现。

嘉宾简介：

陈绪，汇量科技 Mobvista 资深算法架构师。
负责大数据与机器学习平台以及广告推荐算法 Pipeline 开发。

7、《云原生数据湖构建、管理与分析》

议题简介：

数字化是各行各业的发展趋势，数据成为其中最重要的生产资料。数据源越来越多，数据也呈爆发式增长，如何有效的管理数据，充分挖掘数据价值，同时考虑成本性能等因素，数据湖架构越来越多的被提起，本次分享会介绍数据湖架构遇到的一些问题和挑战，以及阿里云云原生数据湖构建、管理与分析的一些实践

嘉宾简介：

宋军，花名嵩林，阿里云智能高级技术专家。
在E-MapReduce 团队从事 Spark 内核优化以及数据湖相关工作，对 Spark /Delta Lake /Hudi 等有深入了解。

8、《异构集群，统一计算在微博机器学习平台中的应用》

议题简介：

主要介绍跨集群，多计算引擎，湖仓一体，统一 SQL 等技术在微博机器学习平台中的应用

嘉宾简介：

金玉梅，新浪微博高级系统开发工程师，机器学习平台离线计算负责人。

9、《人工智能算法与医学影像分析》

议题简介：xxxxxxx

嘉宾简介：

王宇，花名同构，阿里巴巴达摩院高级算法专家