IBM,Cloudera加入Rstudio以创建R接口到Apache Spark

2021-10-04 15:46:36来源:

R用户现在可以使用流行的Dloptr包来点击Apache Spark Big数据。

根据Rstudio,新的Sparklyr包是火花的本机Dplyr接口。根据RStudio博客文章,用户可以“使用DOLER和SQL(通过DBI)以及”过滤器和聚合火花数据集以“交互式操作火花数据”,然后将它们带入R以进行分析和可视化。“还可以访问Spark分布式机器学习算法。

根据Sparkly部署文档,连接到本地火花群将在下面的代码中查找类似:

库(Sparklyr)SC < - Spark_Connect(Master =“Spark://本地:7077”)

而且,使用Sparklyr运行SQL可能如下所示:

库(DBI)IRIS_PREVIEW < - dbgetQuery(SC,“选择*从IRIS限制10”)
返回科技金融网首页 >>

版权及免责声明:凡本网所属版权作品,转载时须获得授权并注明来源“科技金融网”,违者本网将保留追究其相关法律责任的权力。凡转载文章,不代表本网观点和立场,如有侵权,请联系我们删除。


相关文章