数据

  • 百里挑一“萃取”数据精华,上海AI实验室开源发布高质量语料“万卷CC”
    百里挑一“萃取”数据精华,上海AI实验室开源发布高质量语料“万卷CC”

    近日,上海人工智能实验室(上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”(WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符(100B token),约400GB的高质量英文数据。作为“大模型语料数据联盟”今年首发的开源语料,WanJuan-CC将为学界和业界提供大规模、高质量的数据支撑,助...

    • 厂商稿件
    • 2024-03-13 14:04
  • Hitachi Vantara推出简化平台Pentaho+,面向可信、生成式AI就绪型数据
    Hitachi Vantara推出简化平台Pentaho+,面向可信、生成式AI就绪型数据

    架构支持在 Pentaho 数据集成、Pentaho 数据目录和 Pentaho 数据存储优化器 10.0 版本之间实现无缝互操作性日立集团 (TSE: 6501) 旗下专注数据存储、基础架构与混合云管理的子公司 Hitachi Vantara 今天宣布推出 Pentaho+ 平台。该平台是 Pentaho 软件业务的一个集成式平台,旨在...

    • 网络
    • 2023-12-07 09:05
  • 【2023云栖】陈守元:阿里云开源大数据产品年度发布
    【2023云栖】陈守元:阿里云开源大数据产品年度发布

    本文根据 2023 云栖大会演讲实录整理而成,演讲信息如下:演讲人:陈守元 | 阿里云计算平台事业部开源大数据产品总监演讲主题:阿里云开源大数据产品年度发布随着云计算的不断发展,未来数据处理和应用的趋势将围绕Cloud Native、Severless和Data+AI展开。其中,云原生架构已成为主流趋势,因为它可以提高数据处理和应用程序的...

    • 网络
    • 2023-11-21 11:55
  • 【2023云栖】刘一鸣:Data+AI时代大数据平台建设的思考与发布
    【2023云栖】刘一鸣:Data+AI时代大数据平台建设的思考与发布

    本文根据2023云栖大会演讲实录整理而成,演讲信息如下:演讲人:刘一鸣 | 阿里云自研大数据产品负责人演讲主题:Data+AI时代大数据平台应该如何建设今天分享的主题是Data+AI时代大数据平台应该如何建设,这个话题既是对我们过去一年工作的反思和总结,同时也是希望通过这个反思和总结,不管大家是否使用阿里云的平台和技术,在未来大数据平台的...

    • 网络
    • 2023-11-16 09:36
  • 【云栖2023】王峰:开源大数据平台3.0技术解读
    【云栖2023】王峰:开源大数据平台3.0技术解读

    本文根据2023云栖大会演讲实录整理而成,演讲信息如下:演讲人:王峰 | 阿里云研究员,阿里云计算平台事业部开源大数据平台负责人演讲主题:开源大数据平台3.0技术解读实时化与Serverless是开源大数据3.0时代的必然选择 阿里云开源大数据平台孵化于阿里巴巴集团内部业务。早在2009年,我们就开始采用开源 Hadoop 技术...

    • 厂商稿件
    • 2023-11-13 10:37
  • 【云栖2023】林伟:大数据AI一体化的解读
    【云栖2023】林伟:大数据AI一体化的解读

    本文根据2023云栖大会演讲实录整理而成,演讲信息如下:演讲人:林伟 | 阿里云研究员,阿里云计算平台事业部首席架构师,阿里云人工智能平台PAI和大数据开发治理平台DataWorks负责人演讲主题:大数据AI一体化的解读 今年是AI大爆发的一年,大语言模型的诞生推动了席卷整个行业的大模型热潮,许多人认为“AI的iPhone时代...

    • 企业稿件
    • 2023-11-09 09:40
  • 搭建灵活可扩展、更具网络弹性且可持续的现代化数据基础架构
    搭建灵活可扩展、更具网络弹性且可持续的现代化数据基础架构

    Hitachi Vantara中国区内容与数据管理高级顾问 张文天近期,Hitachi Vantara发布了《现代化数据基础架构动态》报告(以下简称“报告”),旨在了解大型企业在以安全、可持续的方式管理数据基础架构方面面临的挑战。中国受访者为Hitachi Vantara提供了宝贵的市场洞察,帮助我们了解中国企业在构建新型现代化数据基础架...

    • 厂商稿件
    • 2023-08-24 21:42
  • 图数据的深度学习模型:图卷积网络(GCN)
    图数据的深度学习模型:图卷积网络(GCN)

    图卷积网络(Graph Convolutional Network,GCN)是一种针对图数据的深度学习模型,能够有效地进行节点分类、链接预测、图分类等任务。GCN基于卷积神经网络(CNN)的思想,通过局部共享权重的方式对节点进行聚合,实现了对图数据的卷积操作。GCN的核心思想是利用邻居节点的信息对当前节点进行特征表示,其中邻居节点是通过邻...

    • AIUST.Com
    • 2023-03-17 12:06
  • “三步走”混合云战略全面发力,让数据流动行云流水
    “三步走”混合云战略全面发力,让数据流动行云流水

    Hitachi Vantara中国区内容与数据管理高级顾问 张文天随着经济回暖,全球云计算市场增速反弹。根据Gartner的数据,全球公有云市场规模在2021年达到了3,307亿美元,增速高达32.5%。同时,中国信通院最新《云计算白皮书(2022年)》指出,我国云计算市场快速发展,公有云市场高歌猛进,在2021年其规模达到了2,181亿...

    • AIUST.Com
    • 2022-12-12 16:07
  • 云原生时代,从架构转型畅谈数据库的变革
    云原生时代,从架构转型畅谈数据库的变革

    从传统关系型数据库到云数据库,数据库在不断演进。与此同时,它也发挥着越来越重要的作用。从云计算、新媒体、音视频、云游戏到移动 App,几乎各行各业都离不开数据库。一方面,数据库作为 IT 基础设施的关键一环,对企业业务的发展起着支撑作用;另一方面,数字化在经济社会中不断深入,数据成为核心要素,围绕数据的生产、存储和消费均依赖数据库。IDC...

    • 厂商稿件
    • 2022-11-25 15:10
  • SAS击球实验室向青少年展示数据与分析的价值
    SAS击球实验室向青少年展示数据与分析的价值

    SAS帮助青少年提高棒球击球率和数据素养,做好准备迎接数据驱动的未来对很多人来说,五月意味着新修剪的草坪、粉笔划出的垒线和球棒上特有的裂纹。北卡罗莱纳州研究三角园区长久以来就是创新的摇篮,最近这里又孕育了一项新的教育计划,将最新技术应用于棒球和垒球运动之中。分析领域的领导者SAS创建了击球实验室(The Batting Lab),使用人工...

    • 厂商稿件
    • 2022-06-08 16:55
  • 人工智能已深入各个领域,人们对大数据却不了解,未来将如何发展
    人工智能已深入各个领域,人们对大数据却不了解,未来将如何发展

    人工智能已经成为信息领域的新宠,也成为各大企业拓展新业务的发展方向。用技术实现产业升级,大数据、ai人工智能与云计算融合创新已成为企业拓展新业务的重要途径。可见,大数据是一个相对宽泛的概念,包括的内容非常多,一个人工智能强大程度的竞争正在逐步加剧。近年来大数据、人工智能等概念在人工智能各个业务领域频繁火热、推广,想把这个概念真正变成现实,...

    • 网络
    • 2021-06-14 09:54
  • Dronestream发布了其实时无人机数据流平台新版企业版
    Dronestream发布了其实时无人机数据流平台新版企业版

    Dronestream发布了其实时无人机数据流平台的新企业版,该平台是根据数千名现有客户的反馈从头开始构建的。新Enterprise平台中添加的新功能包括完全改版的安全Web门户以及用于提高可用性的移动应用程序。无人机飞行员可以利用即插即用功能,而无需专业技术知识来设置视频和数据流。企业可以从门户网站管理飞行员的使用情况,查看者,记录等。...

    • AIUST.COM
    • 2020-08-18 16:33
  • 数据科学50年,数据科学家是否依然是21世纪最性感的职业?
    数据科学50年,数据科学家是否依然是21世纪最性感的职业?

    在如今的数据智能时代,几乎所有人都相信“数据的真实价值就像漂浮在海洋中的冰山,第一眼你只能看到冰山一角,而绝大部分则隐藏在表面之下。”当数据的价值依然在冰山之下隐藏,外面的世界便弥漫着对数据的渴望。一...

    • IT168
    • 2020-05-29 20:06
  • 酷酷的口罩自拍可能被用于人脸识别数据集,你肯吗?
    酷酷的口罩自拍可能被用于人脸识别数据集,你肯吗?

    突如其来的新冠肺炎,对全世界都造成了不小的影响。各国都开始执行社交禁令,人人出门在外必备口罩。而随着人们口罩佩戴的时间变长、人数变多,人脸识别的问题就逐渐显现出来。虽然口罩能够帮助我们抵御病毒 ,但先...

    • 网络
    • 2020-05-27 09:08
  • 大数据产业与隐私计算的碰撞:变革与机遇
    大数据产业与隐私计算的碰撞:变革与机遇

    在大数据产业形成,数据孤岛存在和大量产业数据没有得到有效挖掘的当下,隐私计算能带来行业的变革。随着移动互联网、物联网、云计算的深入发展,大数据国家战略的加速落地,大数据体量呈现爆发式增长态势。数据显示...

    • PlatON
    • 2020-04-14 23:44
  • 数据要素采集标准化如何保障
    数据要素采集标准化如何保障

    4月9日发布的《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(以下简称《意见》)中,首次将数据与土地、劳动力、资本、技术等传统要素并列为要素之一。《意见》具体指出,发挥行业协会商会作用...

    • 科技日报
    • 2020-04-14 22:33
  • 我国全域高精度数字土壤数据库建成
    我国全域高精度数字土壤数据库建成

    记者从中国农业科学院获悉:由该院农业资源与农业区划研究所牵头,联合我国12家专业科研院所,历时21年共同完成了覆盖我国全域的高精度数字土壤数据库。据悉,这是我国迄今最完整和精细的土壤资源与质量科学记载。据...

    • 人民日报
    • 2020-04-08 16:10
  • 全球最大射电望远镜FAST正式“上岗” 数据量同样达“天文级”
    全球最大射电望远镜FAST正式“上岗” 数据量同样达“天文级”

    近日,全球最大射电望远镜“——500米口径球面射电望远镜(FAST)顺利通过国家验收,正式开放运行。这个被称为“中国天眼”的射电望远镜提升了中国射电天文研究和技术水平,也推动了产业技术的创新与发展。作为目前...

    • 环球科技
    • 2020-02-14 17:37
  • 天文学家提出观察暗物质的新方法 基于哈勃收集的引力透镜数据
    天文学家提出观察暗物质的新方法 基于哈勃收集的引力透镜数据

    由于暗物质“看不见、摸不着”,且不会与检测设备发生相互作用,所以科学家们很难对它展开直接的研究。当前的理论是,暗物质占据了宇宙 85% 的质量,人类只能通过观察引力的扰动去管中窥豹。近日,澳大利亚和西班牙...

    • cnBeta
    • 2018-12-27 16:26

快讯

人物

  • Kimi智能助手宣布支持200万字无损上下文,不到半年提升10倍 Kimi智能助手宣布支持200万字无损上下文,不到半年提升10倍

    2024 年 3 月 18 日,通用人工智能创业公司——月之暗面(Moonshot AI)宣布在大模型长上下文窗口技术上取得新的突破,Kimi 智能助手已支持 200 万字超长无损上下文,并于即日起开启产品“内测”。对大模型超长无损上下文能力有需求的用户,可到 Kimi 智能助手网页版 kimi.ai 首页申请抢先体验。据了解,Kimi ...

  • 易联众发布民生信息服务大模型平台,助推民生事业提质增效 易联众发布民生信息服务大模型平台,助推民生事业提质增效

    自GPT破圈以来,围绕大语言模型展开的探索之潮席卷各行各业。国家数据局也在2023年年末发布《“数据要素x”三年行动计划(2024—2026年)(征求意见稿)》,提出以科学数据支持大模型开发,建设高质量语料库和基础科学数据集,加速通用大模型与垂直大模型的应用落地。民生领域中,人力资源和社会保障、医疗保障、卫生健康等服务在日常工作中存在高沟...

  • Buzz和Skydio正合作推出输电、配电和变电站资产检查解决方案 Buzz和Skydio正合作推出输电、配电和变电站资产检查解决方案

    Buzz和Skydio正合作推出输电、配电和变电站资产检查解决方案,所有这些都是为了追求更可持续和更有弹性的公用事业基础设施。将Buzz Solutions领先的公用事业资产计算机视觉检测技术PowerAI与Skydio在美国制造的业界领先的自主无人机和Skydio Extend API相结合,使公用事业从业人员能够利用完全自动化的资产管...

本周热文

热门标签