媲美Pandas的数据分析工具包Datatable
发布时间:2019-11-05 02:24:05 所属栏目:教程 来源:新猿IT人
导读:副标题#e# 前言 Data.table 是 R 中一个非常通用和高性能的包,使用简单、方便而且速度快,在 R 语言社区非常受欢迎,每个月的下载量超过 40 万,有近 650 个 CRAN 和 Bioconductor 软件包使用它。如果你是 R 的使用者,可能已经使用过 data.table 包。 而
与 Pandas 类似,datatable 同样具有分组 (GroupBy) 操作。下面来看看如何在 datatable 和 Pandas 中,通过对 grade 分组来得到 funded_amout 列的均值:
.f 代表什么 在 datatable 中,f 代表 frame_proxy,它提供一种简单的方式来引用当前正在操作的帧。在上面的例子中,dt.f 只代表 dt_df。 过滤行 在 datatable 中,过滤行的语法与GroupBy的语法非常相似。下面就来展示如何过滤掉 loan_amnt 中大于 funding_amnt 的值,如下所示。 保存帧 在 datatable 中,同样可以通过将帧的内容写入一个 csv 文件来保存,以便日后使用。如下所示: 有关数据操作的更多功能,可查看 datatable 包的说明文档 地址:https://datatable.readthedocs.io/en/latest/using-datatable.html 总结(编辑:南京站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
相关内容
- 技术、内容、渠道、服务?凭什么3Glasses成为三大运营商青睐
- 大数据干货:Hadoop 面试中 7个必问问题及答案
- Splunk利用Splunk Connected Experiences和Splunk Business
- VR节奏游戏《Pistol Whip》推出最新内容更新“Akuma”
- 日本VR/AR内容厂商Psychic VR Lab发布Styly最新版本
- 卡内基梅隆大学研究团队推出全新VR触觉解决方案“Wireality
- TCP到底怎么做流量控制?
- 英国VR/AR广告公司Admix完成700万美元A轮融资
- 强强联合,中国联通与3Glasses于3月17日举行战略合作线上发
- 这七家BAT公司,谁家数据科学家更多