数据计算

从聚类角度重新审视 Mask Transformer
数据计算

从聚类角度重新审视 Mask Transformer

7 0

全景分割是一个计算机视觉问题,是许多实际应用的核心任务。由于其复杂性,先前的工作通常将全景分割分为语义分割(为图像中的每个像素分配语义标签,例如“人”和“天空”)和实例分割(识别和分割图像中的可数对象,例如“行人”和“汽车”),并进一步将其...

数据中心现在被视为英国关键国家基础设施
数据计算

数据中心现在被视为英国关键国家基础设施

22 0

英国政府正在大力投资数据中心,以增强对网络威胁的防护。英国最近将其数据中心指定为“关键国家基础设施”,此举旨在加强其对网络威胁的保护。这一新分类将数据中心与水和能源等其他基本服务相提并论,突出了它们在维护国家通信和经济方面的重要性。这项声明...

宣布专利短语相似度数据集
数据计算

宣布专利短语相似度数据集

22 0

专利文件通常使用法律和高度技术性的语言,其中的上下文相关术语的含义可能与口语用法完全不同,甚至在不同文件之间也存在差异。使用传统的专利搜索方法(例如关键字搜索)搜索超过一亿份专利文件的语料库的过程可能非常繁琐,并且由于使用的语言广泛且不标准...

2023 年美国无线数据使用量创历史新高
数据计算

2023 年美国无线数据使用量创历史新高

24 0

CTIA 呼吁提供更多的授权频谱,以满足无人机、自动驾驶汽车和太空探索等行业对无线技术日益增长的需求。根据无线行业协会 CTIA 的一项调查,2023 年美国无线数据消费量将超过 100 万亿兆字节,比上一年增长 36%。26万亿兆字节的增...

数据卡手册:数据集文档透明度工具包
数据计算

数据卡手册:数据集文档透明度工具包

26 0

随着机器学习 (ML) 研究转向能够执行众多下游任务的大规模模型,对数据集的起源、开发、意图和演变的共同理解对于负责任且明智地开发 ML 模型变得越来越重要。然而,关于数据集的知识(包括使用和实现)通常分布在团队、个人甚至时间之间。今年早些...

报告警告称,英国国家犯罪局每年损失 20% 的网络专家
数据计算

报告警告称,英国国家犯罪局每年损失 20% 的网络专家

21 0

一份报告警告称,英国国家犯罪局资源严重不足,由于薪酬体系崩溃,每年损失近 20% 的网络专业人员,危及其有效打击严重犯罪的能力。英国国家犯罪局(NCA)曾被视为英国打击包括网络犯罪在内的严重有组织犯罪的前线防线,但根据英国一家专注于金融腐败...

EHR-Safe:生成高保真且保护隐私的合成电子健康记录
数据计算

EHR-Safe:生成高保真且保护隐私的合成电子健康记录

28 0

电子健康记录 ( EHR ) 分析在增强患者护理、定量衡量临床实践绩效和促进临床研究方面具有巨大潜力。在 EHR 数据上训练的统计估计和机器学习 ( ML ) 模型可用于预测各种疾病(如糖尿病)的概率、跟踪患者健康状况以及预测患者对特定药物...

Flan Collection:推进指令调整的开源方法
数据计算

Flan Collection:推进指令调整的开源方法

28 0

现在,语言模型能够通过读取指令(通常是它们以前从未见过的指令)来执行许多新的自然语言处理(NLP) 任务。推理新任务的能力主要归功于对各种独特指令(称为“指令调整”)进行模型训练,该指令由FLAN引入,并在T0、超自然指令、MetaICL和...

开源 Vizier:迈向可靠、灵活的超参数和黑盒优化
数据计算

开源 Vizier:迈向可靠、灵活的超参数和黑盒优化

24 0

Google Vizier是 Google 内部针对目标函数和超参数进行黑盒优化的事实上的系统,它为 Google 一些最大的研究工作提供服务,并优化了各种产品(例如搜索、广告、YouTube)。在研究方面,它不仅为用户减少了语言模型延迟、...