Python数据工具箱—其他Python协同数据工作工具

其他Python协同数据工作工具指除了上述主题以外,其他在数据工作中常用的工具或库。

/函数 描述 推荐度
tesseract-ocr [外部工具]这是一个Google支持的开源OCR图文识别项目,支持超过200种语言(包括中文),并支持自定义训练字符集,支持跨Windows、Linux、Mac OSX 多平台使用 ★★★
RPython [第三方库]R集成库 ★★★
matpython [第三方库]MATLAB集成库 ★★★
Lunatic Python [第三方库]Lua集成库 ★★
PyCall.jl [第三方库]Julia集成库 ★★
PySpark [第三方库] Spark提供的Python API ★★★
dumbo [第三方库] 这个模块可以让Pythoner轻松的编写和运行 Hadoop 程序,程序版本比较早,可以作为参考 ★★
dpark [第三方库]Python对Spark的克隆版本,类MapReduce框架 ★★
streamparse [第三方库] Streamparse允许通过Storm对实时数据流运行Python代码 ★★★

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>