米兰体育:印度运动员勇拼实力,迎击强手斩获多金

admin 2周前 阅读:11 评论:0
     Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。  寻找一个好的机器学习数据集往往是一个开发人员在启动任何数据科学项目之前必须要面临的最大障碍。无论你是机器学习的新手,还是一个专业的数据...

  

米兰体育:印度运动员勇拼实力,迎击强手斩获多金

  Python部落(python.freelycode.com)组织翻译,禁止转载,欢迎转发。

  寻找一个好的机器学习数据集往往是一个开发人员在启动任何数据科学项目之前必须要面临的最大障碍。无论你是机器学习的新手,还是一个专业的数据科学家,找到一个好的机器学习数据集是提取可行见解的关键。我们编辑了下面11个我们最喜欢的公开数据集。

  /r/数据集

  https://www.reddit.com/r/datasets

  Reddit的/r/数据集提供了一个很大众化的方式共享和请求数据集。在这里,你会发现各种各样的数据从链接深度学习数据集,如印度电影人脸数据库,包括从各种电影的100个印度演员的照片,到每个国家禁止车牌的DMV的数据集。这大概是最随机的和无组织的数据编辑,但提供了一些意外的发现。

  自然地球数据

  https://www.naturalearthdata.com/

  地球自然包括一个相对较小的地理空间数据的数据集,并针对网络地图应用程序进行了特别的优化。这些数据集包括在两个栅格数据层中的地图数据,和矢量层。其中包括文化数据,国家,边界线,人口归属,水边界,等等。矢量数据可以作为ESRI形状文件而栅格数据在TIFF格式是可用的。此数据源可以很容易地将地图工具集成到本地或Web应用程序中。

  加州大学欧文分校机器学习库

  https://archive.ics.uci.edu/ml/

  众所周知并且被大量应用的UCI机器学习库包含了不同的用于机器学习应用的数据集。在这里你会发现数据集按任务分类(例如分类;回归),数据类型(例如多变量,时间序列),等等。最近的数据集包括意大利的空气质量,学生的酒精消费量,和全球定位系统的轨迹。其他有趣的数据集包括从意大利葡萄酒的化学成分,鲍鱼的物理特性,和心脏病数据。每个数据集都有丰富的元数据,包括相关文件,数据源,数据类型,等等。数据有多种形式,包括.CSV和.zip。

  谷歌趋势数据存储

  https://googletrends.github.io/data/

  如果你想使用搜索引擎做基于时间维度的概念探索及证明,那么谷歌趋势是很好的工具。谷歌趋势通过可视化,区域图,兴趣变化趋势,以及查询历史来展示热门查询。并以区域或类别为基础改善你的搜索,如商业,娱乐,体育等等。探索不同趋势基于时间维度的相互比较也很有趣,如过去十年的气候改变,全球变暖,经济衰退,经济上的相互比较。可以查看网页上的实时趋势数据并且所有数据集都能够下载为CSV文件。

  想知道更多吗?看看这个攻击谷歌趋势API指南。

  机器学习数据集存储库

  https://mldata.org/

  机器学习数据集存储库是一个从劳动攻击数据到网络分析数据的数据集的集合。这些数据集包括元数据,如许可、依赖关系和属性类型。他们可以是各种不同的格式,如.ZIP,.TAR,.CSV,和.XML。机器学习的数据集可搜索,分类,并标记星级,下载数量,和评论,因此你可以直截了当地找到你所需要的。

  美国地质调查局

  https://www.usgs.gov/products/data-and-tools/overview

  美国地质调查局是一个自然资源和地质数据的金矿。探索从生物学到气候变化到矿物数据的话题。该网站还提供了访问实时数据,科学研究数据,当然还有地理信息系统数据集。美国地质调查局还提供访问不同的端点,如水服务API提供了一个数据目录的工具用于浏览地理空间和自然资源数据。从数据目录的数据集包括生物多样性计数,地下水枯竭,地热数据,等等。每个数据门户包括广泛的元数据文档和可作为形状文件。zip格式或与该格式的栅格数据集。非GIS数据是可用的。CSV、JSON、XML和更多。每个数据门户包括广泛的元数据文档和可以作为形文件的.zip格式或者.GXF格式栅格数据集。非GIS数据可以使用.CSV, JSON, XML等格式。

  深度学习数据集

  https://deeplearning.net/datasets/

  一点不足为奇,深度学习数据集可以完美地作U+7528于深度学习算法!这些数据集涵盖一切从象征性的音乐,到自然图像,人脸,文本和语音。这些数据集大多数是众所周知的,如Penn树图资料库和MNIST,然而把这些深度学习数据集放在一个地方是非常有用的。

  皮尤研究中心数据集

  https://www.pewresearch.org/data/download-datasets/

  皮尤研究中心针对社会和人口趋势提供关于宗教、政治、科学、科技和媒体的数据集。这些机器学习的数据集是基于公民投票,调查和问卷调查。在填写完一个基本的表格,并接受他们的使用协议后该数据集可供下载。由于数据来自民意调查,它通常包括布尔和非结构化的文本数据。

  开放数据网络(Socrata)

  https://www.opendatanetwork.com

  Socrata开放数据网络对于查找和访问开放政府数据是很适合的。由于政府网站很难导航,Socrata API是找到开源数据集的好方法,并不是所有的机构、区域和数据集都可用。该Socrata API也适用于查询具体的问题,例如:诺曼的人口是多少?这将返回一个地图和人口数据。该接口还允许您将该数据集与全国各地的类似的城镇进行比较,并提供有关您查询位置的其他问题。

  开放式数据栈交换

米兰体育:印度运动员勇拼实力,迎击强手斩获多金

  https://opendata.stackexchange.com/

  堆栈交换中有一段称为开放式数据。它致力于关于在哪里找到特定的数据集的问题和答案。这个问题的集合被发布出来用于提供寻找新数据集的方法。关于在哪里找数据集的问题,主题范围从足球运动员的身体数据到由他们的icd - 10编码组织的疾病计数的数据源。并不是所有张贴在这里的问题都被回答了。

  数据是复数

  https://docs.google.com/spreadsheets/d/1wZhPLMCHKJvwOkP4juclhjFgqIY8fQFMemwKL2c64vk/edit#gid=0

  谷歌表编辑了一些到有趣的数据集和数据源的链接。它定期更新,也可作为每周时事通讯。链接数据源的范围从弗林特水样本(这包含与弗林特水样本有关的多个数据源和不同数据集)到美国每一个地方的名字。

  虽然这只是一个机器学习数据集的样本,我们希望它提供了一个起点,找到你要寻找的数据集。你最喜欢的数据集的来源是什么?@Algorithmia让我们知道,我们会将它添加到列表中!

  当你准备好你的机器学习模型的时候,我们会在这里帮助你。我们准备了scikit-learn, nltk,Caffe, TensorFlow, Theano模型,并将其转化为可扩展的网络服务。

  英文原文:https://blog.algorithmia.com/machine-learning-datasets-for-data-scientists/

  译者:StephenYao

版权声明

本文仅代表作者观点,不代表米兰体育立场。
本文系作者授权米兰体育发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

发表评论
热门文章
  • 米兰体育:塞内加尔篮球超霸联赛季后赛殚精竭虑

    米兰体育:塞内加尔篮球超霸联赛季后赛殚精竭虑
    1、每年召开一次全乡中小学幼儿园文化体育艺术节一次篮球联赛一次足球联赛,每年组织一次老教师课赛和一次新教师课赛,举行一。 2、那勇往直前以赴之殚精竭虑以成之的精神鼓舞着钢三学子逐梦而行!END编辑 张偲宇撰稿 段妮妮视频 李源一审 王亚妮二审。 3、教练们的指导更是筚路蓝缕,殚精竭虑,为球队打造极具特色的阵容和战术过去一年中,经验丰富的教练们,带领二十名足球少年。4、我们的球赛组委会几位同志,一直都在为球赛的组织运行殚精竭虑,令人钦佩聚沙成塔聚腋成裘,涓涓细流汇成大河,每一个...
  • 米兰体育:皇家马德里力挽狂澜,成功晋级

    米兰体育:皇家马德里力挽狂澜,成功晋级
    1 在加时赛中,西甲皇家马德里队主场通过加时赛以31逆转英超曼城队,两回合总比分65淘汰对手,成功晋级2 这场胜利被皇马球员和球迷称为“奇迹”。4 比赛伊始,拜仁慕尼黑便掌控了比赛的节奏,其精湛的传球和机敏的跑位令皇家马德里防线疲于应对5 仅用15分钟,拜仁慕尼黑的罗本便凭借出色的个人技术,突破了皇家马德里的防守,成功破门得分6 落后的皇家马德里加强了进攻力度,但拜仁慕尼黑的防守坚如磐石,未能让对手取得进球7 下半场,皇家马。1 在欧洲冠军杯和冠军联赛的历史上,拜仁慕尼黑与皇...
  • 米兰体育:叙利亚体育俱乐部队员势如破竹,夺得胜利

    米兰体育:叙利亚体育俱乐部队员势如破竹,夺得胜利
    12月2日,在索尔体育馆,俱乐部前任经理维森克#x2022雷格宣布他将于22天之后离职,而俱乐部主管弗朗西斯#x2022桑斯拿出了一套详细的俱乐部情势纲要,纲要从经济和社会的视角说明俱乐部已危在旦夕在他的一番言论之后,看起来俱乐部似乎真的面临即将解散的危机经过一段死一般的沉默后,一位名叫华莱士的球员站起来大声说道“难。“首先这场胜利给我们带来了三分,下一个目标就是12强赛从第 国足势如破竹半场便取得六球领先,而杨旭更是只用了半个小时就。 同一年,广州女足亚洲杯,势如破竹的中国...
  • 米兰体育:欧国联赛中球员们展现出了顶尖实力

    米兰体育:欧国联赛中球员们展现出了顶尖实力
    德国足球历史悠久,成绩斐然,曾三次夺得欧洲杯冠军,分别在1972年1980年和1996年同时,德国在世界杯历史上也有四次夺冠的辉煌记录这些荣誉彰显了德国足球的强大实力和深厚底蕴西班牙足球同样有着光辉的历史他们曾在1964年2008年和2012年三度夺得欧洲杯冠军,并且在2010年首次捧起世界杯冠军奖杯。 最后的三名球员,菲利克斯可以出现在攻击型中场的位置,他负责串联球队的进攻在菲利克斯的身前,将会由姆巴佩跟哈兰德坐镇,这两名球员也是出了名的ldquo罗我偶rdquo可见,C罗...
  • 米兰体育:快船主帅泰伦-卢赞扬球员努力表现

    米兰体育:快船主帅泰伦-卢赞扬球员努力表现
    1、结果快船看到了最近切换无敌模式的信哥赛后,快船主帅泰龙卢坦言,祖巴克在防守字母哥上做得很好,但还是无济于事小卡指出快船防守信哥的缺点,说需要更多的防守,并表扬了信哥“他是一个好球员,一个伟大的球员,他每晚都竭尽全力他当选MVP是有原因的”据统计,这是Alphabet第61次单场打出;泰伦卢和快船达成一份5年合同,快船果不其然签下泰伦卢是因为卢在骑士的冠军经历季后赛的成功以及强大的沟通能力都可以帮助到快船基于他在作为助教时,经常和球员沟通交流,跟球员关系不错,也让他在竞争帅...