人工智能第二课 机器学习 Orange 开源项目

第一天先在整体上对Orange有个大概的了解,目前我的看法是Orange是做数据挖掘和机器学习开发的框架平台,它本身应该已经包含了好多数据挖掘和分析的算法。

本文暂时用来保存学习资料, 源代码已经下载到本地,明天开始安装学习。

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。

以下内容摘自博客 https://my.oschina.net/u/2306127/blog/548833  。

摘要: Orange是一个基于组件的数据挖掘和机器学习软件,可以基于Qt的图形界面进行可视化流程设计。Orange基于Python进行操作,外围资源应该是相当丰富的,安装使用很简单,功能相当的强大,强烈推荐。这里介绍其安装和源代码的使用方法。

Orange(http://orange.biolab.si/)是一个基于组件的数据挖掘和机器学习软件套装,支持Python进行脚本开发。Orange由斯洛文尼亚大学计算与信息学系的生物信息实验室BioLab进行开发,https://github.com/biolab 是一个实际应用的项目而不仅仅是技术工程,包含了该组织托管的相关开源工程。

这里有不少关于数据挖掘和分析的文章(英文的,有时间了慢慢翻译一些):http://blog.biolab.si/

Orange操作简单,但功能很强大,可以使用Python强大的扩展库资源。具有快速而又多功能的可视化编程前端,以便浏览数据分析和可视化。

Orange包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目、过渡、建模、模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架构建的,可以可视化地进行操作。

安装完毕,启动:

source orange3env/bin/activate
python -m Orange.canvas

源代码托管在:

https://github.com/biolab/orange3

https://github.com/biolab/orange-bio

在Ubuntu上使用这个脚本进行安装:http://biolab.github.io/install-orange/setup-ubuntu.sh

原始文件需要更新,这个是更新后的:

#!/bin/bash

p=$PWD
sudo apt-get update
sudo apt-get -y install git python-pip python-virtualenv python3-dev 
python3-numpy python3-scipy python3-pyqt4 python-qt4-dev python3-sip-dev libqt4-dev

virtualenv -p python3 --system-site-packages orange3env
source orange3env/bin/activate

echo "/usr/lib/python3/dist-packages/" > "orange3env/lib/python3.4/site-packages/0.pth"
pip install --upgrade numpy

git clone https://github.com/biolab/orange3
cd orange3
pip install -r requirements-core.txt
pip install -r requirements-dev.txt
pip install -r requirements-doc.txt
pip install -r requirements-gui.txt
pip install -r requirements-sql.txt
python setup.py develop
cd ..
git clone https://github.com/biolab/orange-bio
cd orange-bio
python setup.py develop

下载其它的相关工程源代码:

#!/bin/bash

source orange3env/bin/activate

git clone https://github.com/biolab/orange3-text.git
git clone https://github.com/biolab/orange3-associate.git
git clone https://github.com/biolab/orange3-network.git
git clone https://github.com/biolab/orange-web.git
git clone https://github.com/biolab/ipynb.git
git clone https://github.com/biolab/orange3-datafusion.git
git clone https://github.com/biolab/orange3-example-addon.git
git clone https://github.com/biolab/datafusion-installation-guide.git
git clone https://github.com/biolab/data-mining-course-unipv.git
git clone https://github.com/biolab/qt-graph-helpers.git
时间: 2024-10-12 11:11:22

人工智能第二课 机器学习 Orange 开源项目的相关文章

百度DMLC分布式深度机器学习开源项目(简称“深盟”)上线了如xgboost(速度快效果好的Boosting模型)、CXXNET(极致的C++深度学习库)、Minerva(高效灵活的并行深度学习引擎)以及Parameter Server(一小时训练600T数据)等产品,在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。

百度为何开源深度机器学习平台? 有一系列领先优势的百度却选择开源其深度机器学习平台,为何交底自己的核心技术?深思之下,却是在面对业界无奈时的远见之举. 5月20日,百度在github上开源了其深度机器学习平台.此番发布的深度机器学习开源平台属于"深盟"的开源组织,其核心开发者来自百度深度学习研究院(IDL),微软亚洲研究院.华盛顿大学.纽约大学.香港科技大学,卡耐基·梅陇大学等知名公司和高校. 通过这一开源平台,世界各地的开发者们可以免费获得更优质和更容易使用的分布式机器学习算法源码,

机器学习的11个开源项目

转自InfoQ,作者张天雷 机器学习是目前数据分析领域的一个热点内容,在平时的学习和生活中经常会用到各种各样的机器学习算法.实际上,基于Python.Java等的很多机器学习算法基本都被前人实现过很多次了.这些算法在网上可以找到很多,然而往往存在很多“脏”或者“乱”的开源代码. 在这样的背景下, InfoWorld近日公布了机器学习领域11个最受欢迎的开源项目,这11个开源项目大多与垃圾邮件过滤.人脸识别.推荐引擎相关.它们大多数基于现今最流行的语言以及平台,推广以及扩展了机器学习领域的很多重要

谷歌开源第二代机器学习系统 TensorFlow

深度学习对计算机科学而言,是有相当深远的影响的.它让尖端科技研究.开发数千万人日常使用的产品成为可能.Research宣布推出第二代机器学习系统TensorFlow,针对先前的DistBelief的短板有了各方面的加强,更重要的是,它是开源的,任何人都可以用. 谷歌内部深度学习结构DistBelief开发于2011年,它让谷歌能够针对数据中心的数千核心,构建更为大型的神经网络和规模训练,典型的应用像是提升谷歌应用中的语音识别能力,以及为谷歌搜索加入图片搜索功能. 不过DistBelief存在一些

2016年GitHub排名前20的Python机器学习开源项目(转)

当今时代,开源是创新和技术快速发展的核心.本文来自 KDnuggets 的年度盘点,介绍了 2016 年排名前 20 的 Python 机器学习开源项目,在介绍的同时也会做一些有趣的分析以及谈一谈它们的发展趋势.和去年一样,KDnuggets 介绍了 GitHub 上最新的并且排名前 20 的 Python 机器学习开源项目.令人吃惊的是,去年一些最活跃的项目已经停滞不前了,也有一些项目跌出了前 20 名(在 contribution 和 commit 方面),当然,也有 13 个新项目进入了前

.NET平台开源项目速览(13)机器学习组件Accord.NET框架功能介绍

Accord.NET Framework是在AForge.NET项目的基础上封装和进一步开发而来.因为AForge.NET更注重与一些底层和广度,而Accord.NET Framework更注重与机器学习算法以及提供计算机视频.音频.信号处理以及统计应用相关的解决方案.该项目使用C#语言编写,项目主页:http://accord-framework.net/ 说明:该文章只是一个基本介绍,主要内容是翻译的官方文档和介绍,部分英文表述个人能力有限,不太熟悉,所以直接照搬原文,有比较确切的知道中文名

Android开源项目第二篇——工具库篇

本文为那些不错的Android开源项目第二篇——开发工具库篇,主要介绍常用的开发库,包括依赖注入框架.图片缓存.网络相关.数据库ORM建模.Android公共库.Android 高版本向低版本兼容.多媒体相关及其他. Android开源项目系列汇总已完成,包括: Android开源项目第一篇——个性化控件(View)篇 Android开源项目第二篇——工具库篇 Android开源项目第三篇——优秀项目篇 Android开源项目第四篇——开发及测试工具篇 Android开源项目第五篇——优秀个人和

C#.NET开源项目、机器学习、Power BI (转载)

.NET技术, 开源项目, 数据挖掘, 机器学习, 微软Power BI, 足球赛事分析, Matlab与C#编程 博客园 管理 本站首页 头条推荐 Power BI .NET开源 机器学习 博客美化 X组件 Matlab 随笔 - 189  文章 - 15  评论 - 4316 [翻译]Awesome R资源大全中文版来了,全球最火的R工具包一网打尽,超过300+工具,还在等什么? 阅读目录 0.前言 1.集成开发环境 2.语法 3.数据操作 4.图形显示 5.HTML部件 6.复用组件研究

C#.NET开源项目、机器学习、商务智能

所以原谅我,不能把所有的都发上来,太杂了,反而不好. 1..NET时间周期处理组件 这个组件很小,主要是对时间日期,特别是处理时间间隔以及时间范围非常方便.虽然.NET自带了时间日期的部分功能,但可能还不强大.这个组件就是增强版本.详细功能可以看项目主页的介绍.在CodeProject: http://www.codeproject.com/Articles/168662/Time-Period-Library-for-NET 2.OxyPlot绘图组件 OxyPlot是一个.NET跨平台的绘图

深度学习优质学习项目大放送!-AI Studio精选开源项目合集推荐

近期 在AI Studio上发现了不少优质的开源深度学习项目,从深度学习入门到进阶,涵盖了CV.NLP.生成对抗网络.强化学习多个研究方向,还有最新的动态图,都以NoteBook的方式直接开源出来,并且AI Studio还提供了免费算力,可直接在线运行跑训练任务,推荐深度学习开发者和学习者收藏和研究. 算力获取链接:https://aistudio.baidu.com/aistudio/questionnaire?activityid=667 A. 深度学习新手入门合集 本集合分为四小节,从零介