阅读774 返回首页    go 阿里云 go 技术社区[云栖]


pyspark原理简介

概述

这是前段时间在看spark的python支持的时候,简单过了一下pyspark里的python代码,整理了一个大致流程。虽然几乎不会python,但基本上能看懂pyspark是怎么让不同虚拟机之间传输数据的、如何在python环境调用java类的、pyspark SDK的丰富程度取决于什么、需要做些什么流程和封装等。

我看了下,应该只有Pyspark Internals这篇wiki里介绍了pyspark的实现机制,大体是下面这张图就可以表示:

最后更新:2017-04-03 05:39:34

  上一篇:go CentOS 6.4安装配置LAMP服务器(Apache+PHP5+MySQL)
  下一篇:go linux c socket 源码案例