首页 > 教程

厌倦了 JupyterLab?试用 DataSpell — 用于数据科学的全新 IDE

2021-09-12 12:23:52小弧光黑板报
数据科学 IDE 市场并未完全饱和。一方面,您拥有 Jupyter 以实现最大的交互性,另一方面拥有 PyCharm 作为专业环境。你也可以使用 VSCode 之类的文本编辑器,但我觉得它们有点烦人。Dataspell -一个IDE完全属于数据科学家。它是预览版,但您可以在此处注册。我已经等了几个星期,直到他们把链接发给我。希望您的等待时间会更短。今天,您将看到此 IDE 必须提供的功能。我们将介绍基本介绍、创建您的第一个笔记本、智能代码帮助、数据库支持、markdown支持等等。剧透警报:太棒了。什么是Dataspell?Dataspell是专为数据科学家设计的 IDE(集成开发环境)。它由Jetbrains开发- IntelliJ Idea 和 PyCharm 背后的一家公司,因此不需要进一步介绍。IDE 尚未正式发布。您必须注册预览版并等待获取下载链接。支持所有主要操作系统平台,包括 ARM (M1) Mac。以下是 IDE 提供的内容(来源):原生笔记本体验——如果你使用过 Jupyter,会有宾至如归的感觉。智能编码辅助——有点像 Jupyter 和 PyCharm 生了孩子。Markdown 和 JavaScript — 根据需要设置笔记本样式并嵌入数据可视化。交互式 shell — REPL 控制台 + 语法检查。SQL 数据库支持— 连接到数据库、直观地检查数据、导入/导出数据等。而且这个东西还在积极开发中!但是废话已经够多了。让我们看看事情是怎样的:图像 1 — Dataspell IDE(作者提供的图像)如果您在 PyCharm 中做过任何事情,它看起来会很熟悉。总而言之,这东西在纸上真的很有能力,看起来很棒。接下来让我们看看如何开始使用笔记本。创建你的第一个笔记本该过程几乎与任何其他 Jetbrains 产品相同。单击根目录并转到New — Jupyter Notebook:图 2 — 创建 Jupyter Notebook我已经命名了我的first_notebook.ipynb。您不必编写扩展程序。这是它的样子:图 3 — Dataspell 中的 Jupyter Notebook(图片由作者提供)风格是个人喜好的东西,但你不能说设计不是一流的。在创建笔记本时,您可能已经看到创建 R 脚本和 Markdown 文件的选项。一旦 Python 正常运行,Dataspell 将同时支持 R 和 Julia(源代码)。现在让我们探索基本的 Python 和数据科学库是如何工作的。下图显示了 Numpy 数组和 Pandas DataFrame:图 4 — Numpy 和 Pandas with Dataspell(作者图片)正如预期的那样。我喜欢 Numpy 数组打印为 Pandas 系列的方式,但这只是个人喜好。Matplotlib 呢?这是一个真正简单的散点图:图 5——带有 Dataspell 的 Matplotlib(作者图片)这就是 JupyterLab 和黑暗主题一直困扰着我的事情。可视化保持白色。明确地说,我更喜欢出版物可视化的白色背景,但在夜间工作时受不了。干得好,Dataspell。接下来,让我们探索每个 IDE 必须具备的功能 — 智能编码辅助。智能编码辅助我不喜欢 JupyterLab 的是缺乏编码帮助。确实有插件,但它们的帮助远不及专业的 IDE。我不喜欢 IDE 的地方是缺乏交互性。希望 Dataspell 将是两全其美的。让我们尝试导入 Numpy,看看会发生什么:图 6 — Dataspell 的编码帮助 (1)(作者提供的图片) 这是第一点——自动完成——它完美无缺。下一位是代码未正确编写时的警告/错误。这是一个例子——add_integers函数应该返回一个整数,但它故意返回一个浮点数:图 7 — Dataspell 的编码辅助 (2)(作者提供的图片) 像宣传的那样工作!接下来,让我们探索 Markdown — 一种使您的笔记本对人类更具可读性的方法。Markdown支持Dataspell 并没有忘记 Markdown。首先,将鼠标悬停在单元格上方并单击Add Markdown Cell:图 8 — 带有 Dataspell 的 Markdown (1)(作者图片) 另一种方法是单击代码下拉列表并将单元格类型切换为 Markdown。这里有一些 Markdown 代码供您尝试:图 9 — Markdown with Dataspell (2)(作者图片) 这是运行单元格时的外观:图 10 — Markdown with Dataspell (3)(作者图片)总而言之 - 大多数事情都按预期工作。但是,我在编写数学方程时遇到了麻烦,因为它们的工作方式与 JupyterLab 中的不同。如果您知道解决方案,请随时发表评论。最后,让我们探索另一个对数据科学至关重要的功能——数据库。数据库支持作为数据科学家,您几乎每天都必须建立和管理数据库连接。当 SQL 写成字符串时,调试长 SQL 行并不容易。Dataspell 有一个解决方案。以下是如何使用该sqlite3包建立连接、创建数据库和表:图 11 — Dataspell 的数据库支持 (1)(作者提供的图片) 您现在可以像往常一样插入数据:图 12 — Dataspell 的数据库支持 (2)(作者提供的图片)Dataspell 的特别之处在于无需离开 IDE 或编写不必要的查询即可浏览数据库的选项。只需双击数据库,就会打开一个新的侧窗口。从那里,您可以轻松单击任何感兴趣的表格,以在单独的选项卡中浏览它:图 13 — Dataspell 的数据库支持 (3)(作者提供的图片)很棒,不是吗?此功能在 PyCharm 的专业版中默认提供,因此您可能不会感到惊讶。问题仍然存在——您应该使用 Dataspell 吗?这个 IDE 的缺点是什么?继续阅读以找出答案。Dataspell 是一款出色的即将推出的 IDE,适用于任何数据科学领域的人。但它是适合您的工具吗?这取决于。数据科学职位因公司而异。如果您从事的编码工作多于数据科学,那么 PyCharm 可能是更好的选择。另一方面,如果您所做的大部分工作都是纯粹的数据科学,那么 Dataspell 就是您的最佳选择。我在 Dataspell 中看到的唯一缺点是定价。不,它不会是免费产品。您可以期待与其他 Jetbrains 产品类似的报价——每年收费 89.00 欧元,每月收费 8.90 欧元。这是另一个没人想要的订阅。我不明白为什么没有一次性购买选项,因为我更喜欢它而不是基于订阅的模型。原文:https://towardsdatascience.com/tired-of-jupyterlab-try-dataspell-a-new-amazing-ide-for-data-science-fb7cbc1280d4