当前位置:首页 >科技 >

帮助数据科学家构建应用程序的Streamlit发布1.0版

来源:   2021-10-12 10:14:54

Streamlit是一种流行的数据科学和机器学习应用程序框架,其版本 1.0已达到里程碑。该开源项目由一家同名公司策划,该公司提供基于该平台构建的商业服务。到目前为止,该项目的 GitHub 下载量已超过 450 万次,并被 10,000 多个组织使用。

该框架填补了想要开发新分析小部件或应用程序的数据科学家与通常需要大规模部署这些小部件或应用程序的数据工程之间的重要空白。数据科学家可以构建 Web 应用程序来访问和探索机器学习模型、高级算法和复杂的数据类型,而无需掌握后端数据工程任务。

Streamlit 联合创始人兼首席执行官 Adrien Treuille 告诉 VentureBeat,“Streamlit 库优雅简洁的结合以及它全部使用 Python 的事实意味着开发人员可以在几个小时内完成通常需要几周时间的事情。”

Treuille 说,这种提高生产力的例子包括将数据应用程序的开发时间从三个半星期减少到六个小时,或者在 Streamlit 中将 5,000 行 JavaScript 代码减少到 254 行 Python 代码。

拥挤的数据科学应用程序

这家总部位于旧金山的公司加入了一个充满了数十种 DataOps 工具的拥挤环境,这些工具希望简化人工智能、分析和机器学习开发的各个方面。Treuille 将公司的快速增长归功于能够填补数据科学家用于快速探索的工具(例如 Jupyter notebook)与公司用于构建强大内部工具(React 和 GraphQL)、前端界面的复杂技术之间的差距(React 和 JavaScript),以及数据工程工具(dbt 和 Spark)。“这种差距对公司来说是一个巨大的痛点,通常意味着丰富的数据洞察力和模型被孤立在数据团队中,”Treuille 说。

从数据科学专业的学生到大公司,每个人都在使用这些工具。该公司在以技术为中心的企业中增长最快,这些企业拥有大量 Python 用户,并且需要快速试验新的应用程序和分析。

“每个公司都有,有很多DAT同样的问题一,很多的问题,和太少的时间来回答所有的人,” Treuille说。

v1.0 中的改进包括更快的应用程序速度和响应能力、改进的自定义以及对状态的支持。该公司计划在明年 2022 年增强其小部件库,改善开发人员体验,并使数据科学家更容易共享代码、组件、应用程序和答案。

相关文章

TOP