文本-SQL转化任务,是将用户的自然语言转化为SQL继而完成数据库查询的工作。例如根据下表,用户输入一个问题,模型将其转换为 SQL,查询数据库得到结果:"-4.52, -9.55"。Query:新浪和人人网的周涨跌幅分别是多 ...
根据简氏防务周刊报道,美国通用原子航空系统公司(GA-ASI)近日展示了MQ-9A“死神”和MQ-9B“海上守卫者”无人机系统的一种新的反潜战(ASW)能力,无人机可以挂载声呐浮标投放器和磁探测仪等反潜载荷进行海上巡逻,还 ...
来自谷歌等单位的学者提出一个基于 transformer 的学习框架,用于以音乐为条件的3D舞蹈生成。设计了一个全新的网络框架,并验证得出获得高质量结果的关键。其中组件之一是深度跨模态 transformer,可以很好地学习音 ...
2020实体关系联合抽取一片红海,各种SOTA方法你方唱罢我方登场,在一些数据集上也是不断刷出新高度,为信息抽取领域带来了新思路,推动了信息抽取领域的发展。本文梳理了实体关系联合抽取取得SOTA的三种方法,以做总 ...
近日,美国联邦贸易委员会(Federal Trade Commission ,FTC)公布了一项特殊的处罚决定:勒令一家名为「Everalbum」的公司删除其从客户手中收集的照片,以及利用这些数据训练出的所有算法。Everalbum 成立于 2013 ...
一个新的时代似乎已经到来。英特尔,这位CPU领域的绝对王者开始频频与“软件为先”和“XPU”等词进行捆绑。同样值得关注的是英特尔的老对手英伟达以及AMD,在过去的一年中,英伟达宣布收购Arm,AMD则提出收购赛灵思 ...
在自然语言处理领域中,一个重要的技术基础就是创建合理的Embedding。Embedding是NLP系统的根基,一个好的Embedding需要能够将原始文本中尽可能多的语义片段进行有效编码。这些语义信息其实并不只是代表一个词的定义 ...
近日,Reddit 上一个帖子热度爆表。主题内容是关于怎样加速 PyTorch 训练。原文作者是来自苏黎世联邦理工学院的计算机科学硕士生 LORENZ KUHN,文章向我们介绍了在使用 PyTorch 训练深度模型时最省力、最有效的 17 ...
2020年底给某大厂做过一个报告,包含两部分内容:一部分是关于计算机体系结构,尤其是CPU结构的演变;另一部分关于处理器芯片设计方法。这里把第一部分内容贴出来回答一下这个知乎问题。首先回顾一下计算机体系结构 ...
ASIC (Application Specific Integrated Circuit )芯片是专用集成电路,是针对用户对特定电子系统的需求,从根级设计、制造的专有应用程序芯片,其计算能力和计算效率可根据算法需要进行定制,是固定算法最优化设计 ...
本周,业界关注的焦点非CES 2021莫属了,英特尔、AMD和英伟达这三家,凭借其市场影响力,以及同时具有半导体行业和消费类产品核心元器件供应商的“双重”身份,是历年CES展最受关注的厂商,今年自然也不例外。这其中 ...
图神经网络可以说是现在AI领域的超级宠儿。针对推荐系统的稀疏性问题,图方法还真的很适合,主要原因有下:推荐系统中存在很多的图结构,如二部图,序列图,社交关系图,知识语义图等,GNN比传统的随机游走等能有更 ...
对于机器学习来说,参数可以算得上算法的关键:他们是历史的输入数据,经过模型训练得来的结果,是模型的一部分。一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性。迄今为止,OpenAI 的 GPT-3是有史以来最 ...
Transformer 不同 head 所关注的序列长度 span 是不一样的,一些 head(如 Head A)重点关注附近较短的信息,而另外一些 head(如 Head B)则关注在范围更大的全文。如果能在训练中利用这一特性,就可以显著减少计算 ...
经过之前一段时间的 NLP Big Bang,现在相对比较平静了,Transformer 派已经占据了绝对的主导地位,在各类应用中表现出色。看标题大家也可以猜个差不多,整理了一系列自《Attention is all you need》之后的对 Vanil ...
TensorFlow 2.4 正式发布!随着对分布式训练和混合精度提供更多支持,加入新的 Numpy 前端及用于监控和诊断性能瓶颈的工具,这个版本的亮点在于推出新功能,以及对性能和扩展方面的增强。
继先前推出代号为TigerLake的第11代Core笔电处理器,这次Intel在CES 2021活动中发布了增强版的Tiger Lake-H。这次发布的为H35系列为4核8线程架构,TDP为35W,目标为厚度仅有1.6公分的超可携式(Ultraportable)电竞 ...
过去十年间,人工智能技术突飞猛进,最疯狂的科幻小说场景现在已经成为我们生活中不可或缺的一部分。十年前,人们在谈论 AI 的理论化和实验,但这些年来,AI 变得更加切实了,也变成了主流。无论是国际标准课程、平 ...
本周,半导体设备市场又传来一则消息,应用材料在收购美国投资公司KKR集团旗下半导体设备供货商Kokusai Electric(原本隶属日立国际电气,在 2018 年 6 月分拆出来,之后被KKR集团纳入麾下)谈判当中,提高了价码, ...
Tensor 是PyTorch的核心数据结构。你可能对tensor的概念已经相当了解了:它是包含若干个标量(标量可以是各种数据类型如浮点型、整形等)的n-维的数据结构。我们可以认为tensor包含了数据和元数据(metadata),元数据用 ...
2020年6月11日,英特尔突然宣布负责硅工程部门(Silicon Engineering Group)的高级副总裁吉姆·凯勒(Jim Keller)因为个人原因辞职,辞呈立即生效。吉姆·凯勒将继续出任公司顾问六个月时间,以协助工作交接。此间很多 ...
要说明什么是多核心CPU或SoC芯片,首先要从CPU核心(Core)说起。我们知道,CPU是中央处理器(Central Processing Unit)的英文简称,它具有控制和信息处理的能力,是电脑和智能设备的控制中枢。如果把传统CPU芯片中的封 ...
在本节中,我们会详细介绍该过程是如何实现的。请注意,我们将会以试图弄清单个单词被如何处理的角度来看待这个问题。这也是我们会展示许多单个向量的原因。这实际上是通过将巨型矩阵相乘来实现的。但是我想直观地看 ...
GPT-2 有着超大的规模,它是一个在海量数据集上训练的基于 transformer 的巨大模型。GPT-2 成功的背后究竟隐藏着什么秘密?本文将带你一起探索取得优异性能的 GPT-2 模型架构,重点阐释其中关键的自注意力(self-att ...
现今流行的生成对抗网络(GAN)只是对抗好奇心的一种特例?在近日 Jürgen Schmidhuber 发表的博客文章中,他重申了这样一种说法。Jürgen 表示,他在 1990 年的一篇文章中详细描述了基于控制器和世界模型这两种循环 ...
服务器的配置以个人使用性价比为主,同时考虑到以后的扩展性像是主板和机箱这些配件配置设置一些冗余。首先是CPU平台的选择,虽然AMD这两年实在是香,但是作为生产力工具考虑到软件库的兼容性问题,还是决定选择inte ...
2010年代对于AI界来说意义重大,这归功于深度学习领域取得了惊人的进步,AI的这个分支因收集、存储和处理大量数据的能力不断增强而变得切实可行。如今,深度学习不仅是一个科学研究课题,还是许多日常应用系统的一个 ...
了解过Pytorch的应该知道其历史包袱比较重,它吸收了Caffe2的底层代码,然后自己借用这部分底层代码来写各种OP的逻辑,最后再暴露出一层Python接口供用户使用。因此第一次接触Pytorch源代码可能有点不太熟悉,基本上 ...
2020年是巨大飞跃的一年。从OpenAI的GPT-3,再到AlphaFold,都是令人振奋的成就。与此同时,数据科学在机器学习、自然语言处理(NLP)、计算机视觉等领域中蓬勃发展。今年2月微软才发布全球最大的深度学习模型,拥有 ...
大家知道 Layer Normalization 是 Transformer 模型的重要组成之一,它的用法有 PostLN 和 PreLN 两种,论文 On Layer Normalization in the Transformer Architecture 中有对两者比较详细的分析。简单来说,就是 P ...
关于模型架构。虽然具有一个隐藏层的神经网络已经可以模拟大部分函数,但是实践证明深度神经网络(即有更多的隐藏层)在图像识别和自然语言处理等任务中具有更优的表现,因此有各类复杂的模型被设计出来,并在相应任 ...
与 CPU 不同,协处理器不能单独存在。只使用协处理器无法造出计算机。协处理器作为专用处理器,可以很好地完成某些特定的任务。最早的协处理器当属英特尔 8087 浮点单元(FPU)。英特尔的 8086 微处理器可以执行整数 ...
近几年,自然语言处理遵循一个规律或者说方法论,大部分在做 Pre-training(预训练),用更复杂的模型、更大的数据量、更多的计算资源进行模型预训练。然后针对领域或者特定任务进行 Fine tuning(微调),还会遇到 ...
像素化(又称马赛克)是一种常见的打码方式,通过降低图像中部分区域的分辨率来隐藏某些关键信息。但是,在你想隐藏信息的同时,有一些技术却反其道而行之,试图将图片还原为原始状态。最近,一个名为 Depix 的 GitH ...
提到代工厂,我们最熟悉的莫过于台积电,英特尔,三星或GlobalFoundries等大公司。许多人甚至可能从未听说过SkyWater,因为它是几年前才从赛普拉斯半导体公司中分离出来的。诸如前三大代工厂都在追逐先进工艺,而Sky ...
在过去一年,一种新的具有高度传染性的冠状病毒破坏了人们的正常生活,它所导致的社会裂痕也威胁到了我们的共同利益。在这一年期间,有大量的机器学习工程师参与其中,设计了用于新冠肺炎(Covid-19)诊断和治疗的工 ...
在NLP领域transformer已经是成功地取代了RNN(LSTM/GRU),在CV领域也出现了应用,比如目标检测和图像加注,还有RL领域。这是一篇谷歌2020年9月份在arXiv发表的综述论文 “Efficient Transformers: A Survey“,值得 ...
到目前为止,很明显,苹果的M1芯片是一件大事。而且,对其他行业的影响也越来越清晰。在这个故事中,我想谈谈这件事对RISC-V微处理器的影响,而这对于大多数读者而言可能并不明显。首先让我为您提供一些背景知识:《 ...
英特尔已从行业王者沦落为命运观察者。“听着,Clayton,我是一个很忙的人,我没有时间听学者们的废话,但是有人告诉我你有这个理论……我想知道你能不能出来向我和我的员工们介绍一下你所学到的知识,告诉我们它是 ...
水果为什么越来越好吃了?网红农产品背后是农业的创新力量。你也许不知道,最近一段时间里最流行的「网红水果」,很多都曾是默默无闻的小众水果。比如云南的人参果,一度无人问津,但随着多次品种改良逐渐有了市场, ...
在时间序列数据中,一个常见的任务是比较两个序列的相似度,作为分类或聚类任务的基础。那么,时间序列的相似度应该如何计算呢?经典的时间序列相似性度量方法总体被分为两 类: 锁步度量(lock-step measures) 和弹性 ...
根据日媒的报道,在不久前举办的线上活动中,欧洲微电子研究中心IMEC首席执行官兼总裁Luc Van den hove在线上演讲中表示,在与ASML公司的合作下,更加先进的光刻机已经取得了进展。摩尔定律的终点是什么?随着5nm光 ...
Transformer虽然效果好,但是却对资源要求比较高,很难在端设备上运行。在传统的Transformer中,每个block中都有Multi-head Attention和全连接层,其中,随着序列长度N的增大,全连接层的计算量是线性增长,而attent ...
大脑仍然是唯一已知的真正通用智能系统的例子。对人类和动物认知的研究已经揭晓了一些关键的见解,如并行分布式处理、生物视觉和从奖赏信号中学习的想法,这些都极大影响了人工学习系统的设计。许多人工智能研究人员 ...
根据 Timnit Gebru 与 Google AI 负责人Jeff Dean被透露的邮件内容,Gebru的论文在提交审核中没有达到发表要求,因此被驳斥;接着,Gebru提出一些要求,如希望谷歌提供论文审核者的名单信息,称如果公司不同意就辞职 ...
深度学习是机器学习的一个子领域,属于人工智能(AI)和物联网(IoT)。然而,如果没有深度学习的应用,自动化和智能就不会达到今天的水平。例如,人工智能在制造业已经取得了长足的进步,比如预测性维修技术。然而,受 ...
继11月亚马逊将 Alexa 语音助手的部分计算任务转移到自主设计的定制设计芯片Inferentia 后,近日,其再次宣布推出了全新的AI训练芯片AWS Trainium,据消息称,这是该公司用于训练机器学习模型的下一代定制芯片。这意 ...
机器学习领域,面对各类复杂多变的业务问题,构建灵活易调整的模型是高阶机器学习工程师必备的工作能力。然而,许多工程师还是有一个想法上的误区,以为只要掌握了一种深度学习的框架就能走遍天下了。事实上,在机器 ...
据韩国经济日报消息,消息人士透露在今天上午的董事会上,韩国现代集团确认将以不到一万亿韩元(约9.21亿美元)购入波士顿动力。消息人士称,为完成波士顿动力收购,现代汽车已聘请高盛(Goldman Sachs)为其顾问, ...
RISC-V 的极简主义让解码器(CPU 前端)变得更简单,代价则是需要执行更多的指令。然而,相对于拓宽流水线这个难题而言,解码不规则指令的问题很好解决,主要难点在于确定指令的长度是否一致。x86 的众多前缀就是个 ...
21世纪中期以来,美国军方开始探索人工智能如何改变战争,俄罗斯也开展了一系列的对老旧设备进行现代化改造的军事改革。随着人工智能技术的发展,美国、俄罗斯都开始将人工智能列入优先发展领域,并利用人工智能技术 ...
这周,让生物科学圈和人工智能圈为之沸腾的,必然是DeepMind宣布蛋白质折叠预测问题已被其攻破的消息。此消息一出,立刻登上了Nature杂志封面,标题直接评论为:“它将改变一切!”李飞飞、马斯克等众多大佬纷纷点赞 ...
借助 TensorFlow 2,可在跨平台、设备和硬件上实现一流的训练性能,从而使开发者、工程师和研究人员能够在他们喜欢的平台上工作。现在,TensorFlow 用户可以在搭载 Apple 全新 M1 芯片或 Intel 芯片 Mac 上的 利用 T ...
芯片制造用到的技术很多,光刻是芯片制造的灵魂技术,但是开始的时候,光刻并不是所有技术中最厉害的。现在大众认识到了芯片的重要性,讨论芯片产业的卡脖子问题时,提到最多的是光刻和光刻机。那么,光刻是如何一步 ...
12 月 1 日消息 苹果的 M1 芯片是苹果在 Mac 上搭载的单核 CPU 基准测试成绩最快的芯片,在多核性能方面,也击败了许多高端英特尔竞品。开发者Erik Engheim 近日分享了对 M1 芯片的深入研究,探讨了苹果新处理器为何 ...
Graph Convolutional Networks图卷积网络涉及到两个重要的概念,Graph和Convolution。传统的卷积主要应用于Euclidean Structure的数据上(排列很整齐、Grid形式的),如图像、语句等,主要是因为欧式结构数据能够保 ...
近日,谷歌AI团队DeepMind所研究的 AlphaFold 算法在生物学领域取得了重要突破:通过蛋白质的氨基酸序列高精度地确定其3D结构。具体而言,是DeepMind的第二代AlphaFold 在国际蛋白质结构预测竞赛(CASP)上击败了其 ...
十年前,一个想法诞生于加利福尼亚大学伯克利分校的一个实验室中,他们创造了一种通用的计算机芯片语言,按照他们的设想,这套指令将被能所有芯片制造商所使用,而不属于任何公司。它本意不是想成为一种令人印象深刻 ...
马斯克有一句名言,“如果不能打败人工智能,那么就加入人工智能的队列”。其实马斯克本人是人工智能技术威胁论者,非常担忧普遍人工智终将毁灭人类,但他没有一味躲闪,而是主动用人工智能来延展人类能力。2020 年 ...
数据湖(Data Lake),湖仓一体(Data Lakehouse)俨然已经成为了大数据领域最为火热的流行词,在接受这些流行词洗礼的时候,身为技术人员我们往往会发出这样的疑问,这是一种新的技术吗,还是仅仅只是概念上的翻新( ...
计算机视觉领域注意力机制的开篇之作。提出了non-local operations,使用自注意力机制建立远程依赖。- local operations: 卷积(对局部领域)、recurrent(对当前/前一时刻)等操作。- non-local operations用于捕获长距 ...
上周,苹果发布了其M1 SoC。M1采用与最新iPhone相同的A14 CPU,和是十年来首个挑战AMD和Intel等公司的非x86 CPU架构。从那时起,多项关于Apple M1 芯片与AMD和Intel综合测试表明,M1在多个领域处于领先。为此我们的 ...
英特尔与AMD的竞争是乌龟与野兔的竞争。但哪家公司是龟?哪家公司是兔?在过去的几个发布周期中,英特尔和AMD的粉丝之间的评论之战一直很激烈,大量的数字墨水都在讨论这些年来哪个公司有了显著的改善,或者没有明显 ...
前不久,苹果发布了在Arm芯片上运行的Mac机器,当我们惊叹于苹果为何能在自言芯片上不断迈出自己坚实的步伐时,背后到底有怎样的故事呢?一家外媒近期采访了苹果公司软件工程高级副总裁Craig Federighi、苹果全球市 ...
YOLO没有显示求取region proposal的过程。Faster R-CNN中尽管RPN与fast rcnn共享卷积层,但是在模型训练过程中,需要反复训练RPN网络和fast rcnn网络.相对于R-CNN系列的"看两眼"(候选框提取与分类),YOLO只需要Lo ...
预测美国 2020 年总统大选结果的一些民调似乎并没有实现准确的猜测。聚合网站 RealClearPolitics 的数据显示,前副总统拜登比现任总统特朗普领先 7 个百分点,而 FiveThirtyEight 的数据显示,拜登在全国平均至少领 ...
先前的研究认为,海马体(大脑中的一个对记忆来讲至关重要的区域)的模式分离可以使神经元形成不同的神经元群组来存储记忆,这样记忆就不会发生混淆。而历经15年的研究,莱斯特大学系统神经科学系主任Rodrigo Quian ...
一通跑分猛如虎,结果发现深度学习框架还不支持。自 9 月份英伟达发布新一代安培架构消费级显卡 RTX 30 系列已过去两个月了,随着芯片代工者三星的产能爬坡,未来更多的人将有机会买到最新架构的 GPU RTX 3080 和 30 ...
苹果又来了。这次发布会上,三款全新的 Mac 正式释出,最大的亮点,是它们都搭载了苹果自主研发的 M1 芯片。为什么苹果要研发自己的芯片?给电脑换「芯」究竟有多难?过去 15 年,苹果电脑使用的一直是英特尔(Intel ...
集成电路(芯片)应用十分广泛,种类很多,型号十分繁杂。只要出现新的应用需求,就会产生新的芯片。要描绘芯片大家族全貌,首先要对它进行分类。芯片的分类方法可以有许多种,例如按晶体管工作状态、制造工艺、适用性 ...
关注CV领域的小伙伴一定都记得Hinton团队在年初提出的SimCLR,采用自监督的对比学习方法进行encoder的训练,各种碾压之前的模型。所以今年我一直在等某个大招,终于在20年的尾巴看到了一丝希望。今天要介绍的这篇工 ...
药物发现和材料科学的一个基本问题是设计具有优化化学性质的任意分子。由于分子本质上是组合在一起的,化学结构中的任何小扰动都可能导致所需分子性质的大变化。因此,这是一个极具挑战性的数学和计算问题。此外,随 ...
苹果,一个将发布会开成连续剧的公司,终于在北京时间2020年11月11日凌晨2点说出了今年的“One More Thing”——M1芯片,以及搭载M1芯片的MacBook Air、MacBook Pro、Mac mini。似乎是从中国国产电视剧学来的套路, ...
今天,苹果推出了搭载了苹果自研Arm桌面处理器的全新的MacBook系列。得益于公司在硬件和软件之间的垂直集成,这是一个巨大的变化,只有苹果公司才能如此迅速地迎来变革。上一次苹果公司在2006年放弃了IBM的PowerPC I ...
预测到 2024 年左右我国军用无人机产销量有望达到全球无人机市场 25%左右的 份额,我国无人机规模预计将达到 170 亿元人民币,未来十年预计我国军用无人机产值 合计或超 1100 亿元人民币。1、无人装备:正在深刻改变 ...
英特尔公司比其他任何一家公司更能代表“硅谷”中的硅。它不仅通过设计引人注目的新电路来保持统治地位,而且还在自己的工厂中将其蚀刻到硅片中。这是英特尔内部的正统观念。为了蓬勃发展,它必须保留制造计算机大脑 ...
搞AI,谁又没有“GPU之惑”?张量核心、显存带宽、16位能力……各种纷繁复杂的GPU参数让人眼花缭乱,到底怎么选?从不到1000元1050 Ti到近30000元的Titan V,GPU价格的跨度这么大,该从何价位下手?谁才是性价比之王 ...
Horovod 是 TensorFlow、Keras、PyTorch 和 Apache MXNet 的分布式深度学习训练框架。Horovod 的目标是使分布式深度学习快速且易于使用。简单来说就是为这些框架提供分布式支持,比如有一个需求,由于数据量过大(千 ...
卷积这个东东是“信号与系统”中论述系统对输入信号的响应而提出的。因为是对模拟信号论述的,所以常常带有繁琐的算术推倒,很简单的问题的本质常常就被一大堆公式淹没了,那么卷积究竟物理意义怎么样呢?其实我们如 ...
AMD(NASDAQ: AMD)今日公布了2020年第三季度营业额为28亿美元,经营收入4.49亿美元,净收入3.9亿美元,摊薄后每股收益0.32美元。非GAAP经营收入5.25亿美元,净收入5.01亿美元,摊薄后每股收益0.41美元。AMD总裁兼首 ...
这几年,在中兴和华为事件的推动下,国内芯片热潮一浪接着一浪。美国动作一次,热度就增加一分。芯片行业是硬科技,不是互联网,不是靠噱头和流量创造经济。搞芯片技术,还得埋头干,坐冷板凳,坚持长期主义。短期的 ...
二值化神经网络BNN由于可以实现极高的压缩比和加速效果,所以它是推动以深度神经网络为代表的人工智能模型在资源受限和功耗受限的移动端设备,嵌入式设备上落地应用的一门非常有潜力的技术。虽然目前的BNN仍然存在着 ...
Marvell的Arm服务器芯片团队发生了重大变动。一方面,他们美国负责这方面的人员仅剩下一支小团队;另一方面,他们在中国大陆和印度的团队也已经基本已被“清理”。按照知情人士的说法,Marvell已经基本上已经宣布放 ...
毫无疑问,AMD已经成功地以较低的价格在竞争中越战越强,但是利润丰厚的高端市场已经使该公司望而却步。对于PC游戏玩家而言。一旦显卡的价格超过几百美元,那么图形芯片领导者 NVIDIA 的产品就占据了上风。在过去的 ...
10月25日,喀什地区疏附县24日发现1例新冠肺炎无症状感染者后,新疆迅速对其密切接触者、密切接触者的接触者进行核酸检测,截至10月25日14时,检测出137人呈阳性,经专家诊断,均为无症状感染者。后疫情时代,无症状 ...
苹果公司的A14由2个Firestorm内核,4个Icestorm小内核和4个GPU组成。此核心配置与A13相似,因此CPU和GPU的所有性能提升都直接取决于体系结构的变化和时钟p频率的提升。A14的Icestorm小核心已经进行了大的修改,L1i c ...
三星电子李在镕副会长于10月13日紧急访问了荷兰的半导体设备厂家——ASML,并与ASML的CEO Peter Wennink先生、CTO Martin van den Brink先生进行了会谈,且媒体《Business Korea》对此进行了报道。ASML是全球唯一一 ...
接连不断的并购案和与频繁的新品发布让半导体芯片行业处于前所未有的大变局之中。9 月 14 日,英伟达宣布以 400 亿美元的价格从软银手中收购 Arm,补强自己在 CPU 方面的短板,以 CPU+GPU 的方式正式进军云数据中心 ...
谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问 ...
人工智能模型到底「理解」了什么内容,又是如何「理解」的呢?回答这个问题对于改进人工智能系统来说至关重要。而不幸的是,计算机科学家解释深层神经网络(DNN)的能力远远落后于我们用它们实现有用结果的能力。一种 ...
一颗芯片从无到有,从有需求到最终应用,经历的是一个漫长的过程,作为人类科技巅峰之一的芯片,凝聚了人们的智慧,而芯片产业链也是极其复杂的,在此,我大致把它归为四个部分(市场需求--芯片设计--芯片制造--测试 ...
1950年1月,在美国普渡大学任教的王守武受留美科协的感召决定回国,为刚解放不久的新中国做一点贡献。然而这一年朝鲜战争爆发,杜鲁门当局对中国留学生回国百般阻挠,王守武只得以回乡探望年事已高的寡母为由,通过 ...
图读出操作,顾名思义,就是用来生成图表示的。它的别名有图粗化(翻译捉急,Graph Coarsening)/图池化(Graph Pooling)。对于这种操作而言,它的核心要义在于:操作本身要对结点顺序不敏感。这是为什么呢?这就不得不 ...
在开始正式介绍图卷积之前,我们先花一点篇幅探讨一个问题:为什么研究者们要设计图卷积操作,传统的卷积不能直接用在图上吗? 要理解这个问题,我们首先要理解能够应用传统卷积的图像(欧式空间)与图(非欧空间)的区 ...
仅使用1%的标签(每类≤13个标签图像),本文提出的方法即可达到73.9%ImageNet top-1准确率,与以前的SOTA相比,标签效率提高了10倍。使用10%的标签,本文的方法可以达到77.5%的top-1准确率,优于使用100%标签的 ...
最近国外半导体逆向工程和IP服务公司ICmasters使用透射电子显微镜(TEM)对Apple的A14仿生芯片系统(SoC)进行了初步分析。揭开了A14裸片(Die)的神秘面纱。裸片尺寸为88mm2,尽管封装了118亿个晶体管,但由于采用了 ...
大浪淘沙沉者为金,风卷残云胜者为王。但对于FPGA这个市场来说,沉者、胜者或许都不是最后的赢家。在2010年以前的FPGA市场中,虽然有赛灵思和Altera两家巨头占据着大部分市场份额,但也有Lattice、Actel等企业在FPGA ...
前段时间OpenCV正式将SIFT算法的实现从Non-free模块移到主库(OpenCV 4.4 发布!SIFT移到主库,新增YOLOv4 和 EfficientDet 推断支持),因SIFT专利到期了(专利授权后,从申请日开始有20年的保护期)。美国林肯总统 ...
DeepMind发表了一项新研究,展示了深度学习如何帮助解决现实系统中的量子力学基本方程问题,相关论文发表在物理学期刊《Physical Review Research》,代码也已经开源。这种新的神经网络架构叫做Fermionic神经网络或F ...
自1950年代以来,中央处理器“ CPU”一直是每台计算机或智能设备的核心;到1990年代以来,GPU或图形处理单元扮演了重要角色;所以,在过去的十年中,计算已经摆脱了PC和服务器的繁琐局限,CPU和GPU为庞大的新超大规 ...
最近几年,经常关注科技圈的朋友们总会发现,每次遇到厂商有重大发布,就总能看到“颠覆”、“极致”、“革命性”等概念出现在发布会上。前几天,iPhone12的发布现场,蒂姆库克就用上了“新纪元”的字眼,准确地说应 ...
深度学习是一个瞬息万变的领域,层出不穷的论文和新思路可能会令人不知所措。即使是经验丰富的研究人员,也很难准确将研究成果传达给公司的公关部门,继而传达给大众。对于初学者来说,理解和实现这些技术有利于打下 ...
近年来,深度神经网络正在计算机视觉、自然语言处理和语音识别等多种领域发挥着重要作用,推动了人工智能的发展。但是,深度神经网络仍存在一些局限性,例如这些模型的决策过程通常无法向用户解释。但同时,在医疗、 ...
芯片行业是一个集人类智慧之大成,超级烧脑,挥金如土,永远追求卓越的行业。也是一个灭门许多前辈行业,信奉成王败寇,永远创新,激烈竞争,看似走火入魔的一个科技江湖。集成电路(芯片)应用十分广泛,它对国民经济 ...
如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可以更有效率的连接用户与内容和服务,节约了大量的时间和成本。如果把推荐系统简单拆开来看,推荐系统主要是由数据、算法、 ...
深度学习是一个广阔的领域,它围绕着一种形态由数百万甚至数十亿个变量决定并不断变化的算法——神经网络。似乎每隔一天就有大量的新方法和新技术被提出来。不过,总的来说,现代深度学习可以分为三种基本的学习范式 ...
近期,中国电科集团电科院开展了陆空协同固定翼无人机“蜂群”系统的相关试验试飞工作,验证了陆上发射和空中投放固定翼无人机“蜂群”开展对地察打、精确打击等各项任务能力。相比于旋翼/多旋翼无人机,固定翼无人 ...
没有顶尖的光刻机,是我国半导体行业发展的最大瓶颈。在这个领域称得上龙头的,荷兰的阿斯麦尔(ASML)首屈一指。10月14日,ASML的首席财务官Roger Dassen就向中国出口光刻机的问题发表了口头声明。他说,与中芯国际等 ...
我们都知道预训练模型的标准范式:pretrain-利用大量的未标记数据通过一些自监督的学习方式学习丰富的语义和句法知识。例如:Bert 的 MLM,NSP 等等。finetune-将预训练过程中所学到的知识应用到子任务中,以达到优 ...
最早的GNN主要解决的还是如分子结构分类等严格意义上的图论问题。但实际上欧式空间(比如像图像 Image)或者是序列(比如像文本 Text),许多常见场景也都可以转换成图(Graph),然后就能使用图神经网络技术来建模。2009 ...
今年6月,OpenAI发布一款强大的文本生成模型GPT-3,不少网友迅速上手用了起来,有人用它写食谱、写歌词,甚至有人用它写博客,愣是以假乱真登上了新闻平台技术板块热榜第一。前不久,OpenAI再次放出大招。这次,研究 ...
英特尔一统服务器芯片江湖已经很久了。虽然在这期间有IBM和MIPS前来挑战,但他们谁都无法撼动英特尔的地位。进入了二十一世纪以后,凭借移动领域而迅速崛起的Arm,为“高处不胜寒”的英特尔增添了一丝火热——Arm开 ...
Application scorecard 进件评分卡,对授信阶段提交的资料赋值的规则。举例:“进件”是传统银行的说法,指申请单。评分卡是对一系列用户信息的综合判断。随着可以收集到的用户信息变多,授信决策者不再满足于简单的 ...
本文从从老祖级别的 word2vec 开始,从头到尾梳理了 GPT 的 「家谱」 和 word2vec 领衔的庞大的 NLP「家族集团」。GPT 不是凭空而出,它是经过了很多人的努力,以及很长一段时间的演化得来的。因此,梳理一下 GPT 的 ...
在CPU芯片领域,延续至今的“摩尔定律”正在随着制程工艺逼近物理极限而有了延缓的趋势,甚至失效的可能。就在摩尔定律的增长放缓脚步的同时,半导体芯片的计算也正在从通用走向专用,其中AI计算正是其中增长最快的 ...
众所周知,深度学习是一个很吃算力的领域,所以,GPU 选得好不好直接决定了你的炼丹体验。那么,哪些指标是你在买 GPU 时应该重视的呢?RAM、core 还是 tensor core?如何做出一个高性价比的选择?文本将重点讨论这 ...
Transformer架构在机器学习领域(尤其是NLP里)是一项热门研究,为我们带来了许多重要成果,比如:GPT-2、GPT-3等写稿机器人;第一代GPT及其性能更优越的“继任者”BERT模型,在众多语言理解任务中以前所未有的数据 ...
协同过滤是基于用户行为设计的推荐算法,具体来说,是通过群体的行为来找到某种相似性(用户之间的相似性或者物品之间的相似性),通过相似性来为用户做决策和推荐。从字面上理解,协同过滤包括协同和过滤两个操作。 ...
这些年来,相信各位闲闲没事,就会在网路各角落看到,不同领域的各路英雄好汉一直有相同疑惑:为何今天的x86 处理器市场,台面上只剩下英特尔和AMD 两家美国公司?顶多再加个存在感稀薄的台湾VIA,和少人知悉的俄罗 ...
文本分类是NLP最常见的应用之一,有了BERT之后更是可以通过小批量数据精调达到不错的效果。但在对速度要求高、没有钱买GPU、移动设备部署的场景下,还是得用浅层网络。今天就跟大家介绍Google最近新出的一个模型—— ...
红帽(Red Hat)宣布向小型生产工作负载以及客户开发团队,推出RHEL免费与低成本RHEL,过去仅限单机使用的免费RHEL,现在允许最多使用至16个系统,同时红帽也让客户的开发团队,不需支付额外费用,就可以使用RHEL。 ...
20世纪初夏普与当时的日本通信运营商J-PHONE发明了夏普 J-SH04,夏普 J-SH04具有拍照功能,2003年4月24日夏普发售了全球首款百万像素手机J-SH53,风靡一时。随着技术的不断突破与革新,新型照相镜头如雨后春笋一样, ...
近日,树莓派基金会宣布推出首款微控制器级产品 Raspberry Pi Pico,售价仅为 4 美元。据官方介绍,很多基于树莓派的项目需要额外集成一些软件读取传感器,包括执行计算、连接网络并驱动执行器等。这种桥接软件和硬 ...
时至今日,React Native 与 Flutter 已经成为两大领先跨平台开发框架。这两套框架之所以极具人气,是因为它们不仅能够简化开发、代码重用等常规工作,同时提供高度原生化的界面外观以及强有力的技术支持。虽然二者的 ...
和 Zabbix 类似,Prometheus 也是一个近年比较火的开源监控框架,和 Zabbix不同之处在于 Prometheus 相对更灵活点,模块间比较解耦,比如告警模块、代理模块等等都可以选择性配置。服务端和客户端都是开箱即用,不需 ...
每个人的指纹都独一无二,在科技发展的现在,指纹已经变成人的另一张身份证。人的指纹简单可以分为三种:“斗形”、“箕形”、“弓形”!这种形状的分布和地区有着很大的关系,比如,中国人、日本人的指纹中,斗形纹 ...
近日,国外一名 16 岁的开发者发布了一则视频,展示自己为一台已经无法正常使用的 iPhone 7 成功移植了 Ubuntu 20.04,并将其作为服务器来使用。发布视频的开发者网名为 Daniel Rodriguez,是一名在校高中生。据 Dan ...
文件系统是计算机中一个非常重要的组件,为存储设备提供一致的访问和管理方式。在不同的操作系统中,文件系统会有一些差别,但也有一些共性几十年都没怎么变化:数据是以文件的形式存在,提供 Open、Read、Write、Se ...
研究人员在人类精子中识别出了特殊的生物标志物,其或能揭示男性后代患自闭症谱系障碍的倾向。这些生物标志物具有表观遗传特性,这就意味着其能够参与调节基因组活性的分子因素的改变(比如不依赖DNA序列的基因表达 ...
近日,信息和软件质量联盟(CISQ)发布的一份报告指出,受疫情影响,很多企业和组织在 2020 年都开始大力向数字化转型靠拢。在这种背景下,基于软件的创新和发展也在迅速扩大。然而,软件数量在实现了迅猛增长的同时 ...
话说,自从2021年开年以来,比特币疯狂上涨了200%。2020年12月经历了一番上涨,达到了2万美元高点已经让人瞠目结舌,然而元旦以来,比特币价格一度突破了4万美元大关。比特币价格的大涨也让许多持有者瞬间成为了千万 ...
大约 4 年前的容器领域,Docker 是唯一的选择。然而,如今情况已然大不同,Docker 不再是是唯一的选择,它只不过是一个容器引擎而已。我们可以用 Docker 构建、运行、拉取、推送或检查容器镜像,但是这里的每一项任 ...
Kubernetes 有很多东西,各种各样的名词,就像洋葱一样,一层一层包裹在一起。许多 Kubernetes 的介绍图都是这样的,解释了涵盖的所有名词。从技术上讲,它是准确的,但是对一些人而言不是很有帮助,本文将其类比于 ...
流式(Stream)亦称响应式,是一种基于异步数据流研发框架,是一种概念和编程模型,并非一种技术架构,目前在各技术栈都有响应式的技术框架,前端的React.js、RxJs,服务端以RxJava、Reactor,Android端的RXJava。由 ...
2014年,在芬兰的一个传染病实验室里,卫生研究员佩特里·拉特拉(Petteri Lahtela)发现了一件奇怪的事情,他突然意识到他所研究的很多问题的条件都存在着重叠。例如,在检查一些医生认为互不相关的疾病时,比如莱 ...
近日,亚马逊前高管 DanRose 公开表示,在 2000 年互联网泡沫破灭之时,资本市场枯竭,亚马逊那个时候每年还要烧上 10 亿美元。其中最大的支出是数据中心使用 Sun 服务器。而后他们用一年的时间淘汰了 Sun,开始采用 ...
近日,知名 Linux 内核开发者 Arnd Bergmann 发起了一个讨论:删除一堆老旧 CPU 的支持。自从 Linux 5.10 官方宣布为 LTS 版本以来,他发现有一些 ARM 平台至少 5 年未维护或使用,因此他研究了这些看上去需要删除的 ...
ZooKeeper 容错指的是:当宕掉几个ZooKeeper节点服务器之后,剩下的个数必须大于宕掉的个数,也就是剩下的节点服务数必须大于n/2,这样ZooKeeper集群才可以继续使用,无论奇偶数都可以选举Leader。例如5台ZooKeeper ...
删库跑路专家、宕机行为艺术家、肥胖版吴彦祖--老K,曾经说过:“打造一个偶尔宕机的系统并不难,难的是经常宕机,一辈子宕机,从来没有稳定过的系统,这才是最难的。”但是,作为一个有追求的技术人,我们要迎男而 ...
构建无法破解的密码,是众多密码学科学家的目标。一种被称为不可区分混淆的加密方式因为太过完美,多年来被认为无法实现。不过最近,三名研究者首次证明不可区分混淆是可行的,这或许是通往完美密码的重要一步。2018 ...
2021年已正式开启,在这一年中,互联网大小巨头们会有哪些绕不过的关键词?创业公司有哪些值得尝试的新机会?今天,深燃送上一份“互联网奋斗指南”。对于巨头来说,反垄断是不得不面临的首要问题,有业内人士分析, ...
TIOBE 本月公布了 2020 年度编程语言,Python 获得四连冠,是过去一年中最受欢迎的编程语言。Python 在 2020 年实现了 2.01% 的正增长;C ++紧随其后,增长 1.99%。而就本月的情况看,C 语言已经挤下 Java,再次第 ...
本文介绍了Linux 终端如何查看最消耗 CPU 内存的进程。其中包括:CPU占用最多的前10个进程、内存消耗最多的前10个进程、虚拟内存使用最多的前10个进程等
在过去一年有很多 Apache 孵化项目顺利毕业成顶级项目(Top-Level Project ,简称 TLP ),在这里我将给大家盘点 2020 年晋升为 Apache TLP 的大数据相关项目。在2020年一共有四个大数据相关项目顺利毕业成顶级项目 ...
虽然计算机的出现,不到百年,然而为了它的出现,所进行的探索和研究,早已经历经数百年的历史。当然准确的说,这些探索和研究在当时实际并不是为了计算机产生而进行的,绝大多数只是做了一个无意的铺垫。或许我们并 ...
Redis作为内存数据库,拥有非常高的性能,单个实例的QPS能够达到10W左右。但我们在使用Redis时,经常时不时会出现访问延迟很大的情况,如果你不知道Redis的内部实现原理,在排查问题时就会一头雾水。很多时候,Redis ...
当开发者通过 API 消费 Twitter 的公共数据时,他们需要获得可靠性、速度和稳定性方面的保证。因此,在不久前,我们推出了 Account Activity Replay API帮助开发者们提升他们系统的稳定性。这个 API 是一个数据恢复 ...
admin ,进行一个二次迭代的开发,其项目本身非常的优质,而在其 template 中去进行一个更改能够使得项目在一开始有一个很好的基础环境,但是如果没有花时间去琢磨透其中三分明细。在后续排雷来说,无疑是非常的困难 ...
Nginx (engine x) 是一款轻量级的 Web 服务器 、反向代理服务器及电子邮件(IMAP/POP3)代理服务器。反向代理(Reverse Proxy)方式是指以代理服务器来接受 internet 上的连接请求,然后将请求转发给内部网络上的服 ...
对每一个计划留英的小伙伴来说,G5超级精英大学都是“人间理想”。顶尖的实力外加超高的人气,G5每年的入学竞争都非常激烈,其中优势专业的课程位置竞争更是一票难求。G5大学有哪些专业堪称世界顶尖?这些“王牌”专 ...
如何去赢得一场数据竞赛呢?总结可以归纳为如下的7点:理解问题;理解;尝试特定问题的一些方案和新策略;花大量的时间尝试;使用正确的工具;合作;集成;更加具体地,我们需要作两步:理解问题以及需要优化的函数 ...
ZooKeeper 是 Apache 的一个顶级项目,为分布式应用提供高效、高可用的分布式协调服务,提供了诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知和分布式锁等分布式基础服务。由于 ZooKeeper 便捷的使用方式 ...
提到锁大家肯定有了解,像 Synchronized、ReentrantLock,在单进程情况下,多个线程访问同一资源,可以用它们来保证线程的安全性。不过目前互联网项目越来越多的项目采用集群部署,也就是分布式情况,这两种锁就有些 ...
要得出哪种语言更快的结论是相当困难的,因为它取决于具体情况。但我们可以认为 Rust 在速度上是 C 语言的竞争对手,它比许多其他流行的语言如 Java 和 Python 速度更快。Rust 提供了很多功能,比如它注重速度、内存 ...
随着12月份的结束,这多灾多难的2020即将过去。这一年,我们经历了疫情大流行,感受了世界百年未有之大变局。新年伊始之际,Nature发表评论员Holly Else文章,预测了2021年科学界最值得关注的十件事。世界卫生组织12 ...
在常见的分布式系统中,总会发生诸如机器宕机或网络异常(包括消息的延迟、丢失、重复、乱序,还有网络分区)等情况。一致性算法需要解决的问题就是如何在一个可能发生上述异常的分布式系统中,快速且正确地在集群内 ...
在庆祝Science创刊125周年之际,Science公布了125个最具挑战性的科学问题。了解前沿科学研究方向,对你的成长或许有所帮助。简单归纳统计这125个问题,其中涉及生命科学的问题占46%,关系宇宙和地球的问题占16%,与 ...
不久前,macOS 还是我的日常工作必备之一。我购买了一台 macbook 笔记本,原因是底层的 BSD Unix 和它漂亮的图形界面。另外,我还有一个 iPhone 手机。但是,我放弃 macOS 也是因为这些相同的原因。我们可以这样看。 ...
为了推动神经科学领域的创新发展,充分展示和宣传神经科学领域的重大科研成果,经中国神经科学学会七届二次常务理事会一致通过,开展2020年度“中国神经科学重大进展”推荐工作。2020年6月1日,《自然一神经科学》在 ...
ISO C++ 委员会正式发布了C++20 标准,命名为 ISO/IEC 14882:2020。草案和正式版本存在细微的差异,因为标准委员会不一定完全采用草案的内容,通常是从草案中剔除部分内容再发布正式版。不过这对于普通开发者几乎没 ...
人才汇聚,为什么全球第一家人工智能大学能够成为本年热点
全球第一所研究型人工智能(AI)大学穆罕默德·本·扎耶德人工智能大学(MBZUAI)在2019年9月成立于阿布扎比。董事会的豪华阵容和重磅奖学金,很快成为青 ...
上周二发生了一件对开源社区可能具有历史性影响的事情,红帽首席技术官Chris Wright和CentOS社区经理Rich Bowen分别宣布了CentOS Linux的未来和功能的重大变化,CentOS Linux 8将是CentOS的最后一个版本。展望未来, ...
强大、灵活、复杂:C++ 的起源可以追溯到 40 年前,但它仍然是当今使用最广泛的编程语言之一。为了找出原因,TechRepublic 采访了 C++ 之父 Bjarne Stroustrup。C++ 的起源可以追溯到 1979 年,那时编程语言的创造者 ...
众所周知,MySQL广泛应用于互联网的OLTP(联机事务处理过程)业务系统中,在大厂开发规范中,经常会看到一条“不建议使用text大字段类型”。下面就从text类型的存储结构,引发的问题解释下为什么不建议使用text类型 ...
从1988年第一个网络蠕虫病毒诞生以来,「互联网危机四伏」的观念就已经深入人心。如果只是这样,不给电脑联网、禁止使用任何可移动储存介质,数据就安全了吗?但专门研究黑客攻击技术的研究者告诉我们,这个想法太天 ...
使用Vue做前后端分离项目时,通常前端是单独部署,用户访问的也是前端项目地址,因此前端开发人员很有必要熟悉一下项目部署的流程与各类问题的解决办法了。Vue项目打包部署本身不复杂,不过一些前端同学可能对服务器 ...
PhantomJs已经停止维护了,所以不太建议继续使用。停止维护的一个原因是chrome发布的headless版本对它造成了一定冲击。不支持WebGL。但是,还是有开发者说可以自己给PhantomJS添加WebGL支持,不过,这个方案目前超出 ...
CentOS 是 Red Hat Enterprise Linux(RHEL)的一个分支,并且由于其坚如磐石的稳定性和兼容性,无疑是在生产服务器上部署的一种流行选择。CentOS 是一个社区驱动的项目,是 RHEL 的分支,并作为 Red Hat Enterprise ...
12月2日,Oracle在其官网正式推出“MySQL Database Service with Analytics Engine”。作为MySQL产品的一个重大增强,这一特性颇引人注目。周末抽空做了个简单了解,各位从中可窥其一二。MySQL,作为最为流行的一款 ...
近日,Kubernetes 团队发布了最新的 1.20 版本,新版本更新了许多内容:存储卷快照功能趋于稳定;Kubectl Debug 进入 Beta;Beta:API 优先级和公平性;IPV4/IPV6 Alpha 功能更新;GA:限制进程 PID;Dockershim 弃 ...
CentOS 官方发文称 CentOS Stream 才是 CentOS 项目的未来,在接下来的一年里,将逐步把开发工作的重心从 CentOS Linux 往 CentOS Stream 转移。随之而来的改变是原本拥有 10 年支持的 CentOS 8 将在2021年年底结束 ...
TIOBE 将在下个月公布 2020 年的年度编程语言,一年内排名率增长最高的编程语言将获得这一称号。目前,Python 以 +1.90% 数据遥遥领先。其次分别是 C++(+0.71%)、R(+0.60%)和 Groovy(+0.69%)。TIOBE CEO Paul ...
在实际的应用场景中,数据存储在HBase集群中,但是由于一些特殊的原因,需要将数据从HBase迁移到Kafka。正常情况下,一般都是源数据到Kafka,再有消费者处理数据,将数据写入HBase。但是,如果逆向处理,如何将HBase ...
硕士研究生大幅扩招,高校能否承载?12月3日,教育部学位管理与研究生教育司司长洪大用回应称,将采取供给精准、硬件扩容等措施确保研究生培养质量。发布会上,教育部学位管理与研究生教育司司长洪大用表示,教育部 ...
在业务增涨过程中,每个企业不知不觉积累积累了一些数据。无论数据是多是少,企业都希望让“数据说话”,通过对数据的采集、存储、分析、计算最终提供对业务有价值信息。此时,大数据平台的搭建就是企业面临的问题, ...
鲁棒性定义为系统在外界扰动或内在噪声存在的情况下仍保持自身功能的能力,来量化扰动在生物系统中的影响,这对大多数生物体的生存至关重要。在从细胞到生物体的所有尺度的生物系统中,分析分子网络在扰动下的鲁棒性 ...
关于dockershim即将灭亡的传言无疑存在严重夸大。如果一直有关注Kubernetes生态系统,很多朋友一时之间可能确实被Kubernetes 1.20版本的发布公告弄得有点不知所措。从公告内容来看,自1.20版本开始dockershim将被全 ...
「量子霸权」再次被实现了吗?今日凌晨,国际著名学术期刊Science刊登了来自中国科学技术大学潘建伟、陆朝阳等研究团队的重磅成果。根据现有理论,其速度比目前世界排名第一的超级计算机日本「富岳」快一百万亿倍, ...
数据量的增长其实一直是随着互联网的发展呈现爆发式增长的,因为各种各样的数据都在不断的被原样或者是经过少量的更改和增补后拷贝到互联网的各个角落。为了适应互联网数据的海量增长,在后端和架构意义上而言,数据 ...
量子计算机是指利用原子、电子等微观物质遵循的物理学规律——“量子力学”的性质去实现计算的计算机。人们一直期待着通过利用微观物质的一些不可思议的性质,来实现远超现有计算机的计算速度。量子计算机一旦实用化 ...
ES(Elasticsearch下文统一称为ES)越来越多的企业在业务场景是使用ES存储自己的非结构化数据,例如电商业务实现商品站内搜索,数据指标分析,日志分析等,ES作为传统关系型数据库的补充,提供了关系型数据库不具备 ...
目前,kubelet中的Docker支持功能现已弃用,并将在之后的版本中被删除。Kubelet之前使用的是一个名为dockershim的模块,用以实现对Docker的CRI支持。但Kubernetes社区发现了与之相关的维护问题,因此建议大家考虑使 ...
什么?Kubernetes 决定弃用 Docker?这是真的。Kubernetes 现已弃用 Docker。目前,kubelet 中的 Docker 支持功能现已弃用,并将在之后的版本中被删除。Kubelet 之前使用的是一个名为 dockershim 的模块,用以实现对 ...
现代数学有数不清的分支,但是,它们都有一个共同的基础——集合论——因为 它,数学这个庞大的家族有个共同的语言。集合论中有一些最基本的概念:集合(set),关系(relation),函数(function),等价 (equivalence), ...
著名数学家丘成桐先生发表了题为“几何:从黎曼、爱因斯坦到弦论”的演讲,追溯了为广义相对论发展奠定基础的的黎曼几何,回顾了影响广义相对论发展的物理学突破,并谈及量子力学和引力理论相结合、引力场量子化将成 ...
近日,AWS发表的一篇文章表达了对 Rust 的热情,概述了自己接受该语言的几种方式。AWS 的 Matt Assay 写道,该公司越来越多地使用 Rust 构建诸如 Firecracker VMM 等关键基础设施,凭借其开箱即用的功能降低达到预期 ...
Prometheus依靠其强劲的单机性能,灵活的PromSQL,活跃的社区生态,逐渐成为云原生时代最核心的监控组件,被全球各大产商用于监控他们的核心业务。然而,面对大规模监控目标(数千万series)时,由于原生Prometheus ...
Julia 语言是近年来科学世界中出现的一匹黑马。物理学家 Lee Phillips 发表了一篇科普文章,介绍了这种科学计算语言的真正魅力所在。最近,我和许多科学家在网上视频见面了很多次,他们对一个新工具感到兴奋。它既不 ...
服务器系统CentOS 6.X,部署了nginx,tomcat,redis等应用,上来先把数据库全备份到本地,然后top命令看了一下,有2个99%的同名进程还在运行,叫gpg-agentd。GPG提供的gpg-agent提供了对SSH协议的支持,这个功能可以 ...
索引对大数据的查询速度的提升是非常大的,Explain可以帮你分析SQL语句是否用到相关索引。索引类似大学图书馆建书目索引,可以提高数据检索的效率,降低数据库的IO成本。MySQL在300万条记录左右性能开始逐渐下降,虽 ...
ZooKeeper是用来协调(同步)分布式进程的服务,提供了一个简单高性能的协调内核,用户可以在此之上构建更多复杂的分布式协调功能。脑裂通常会出现在集群环境中,比如Elasticsearch、ZooKeeper集群,而这些集群环境 ...
假设您正在开发一个Java程序,有许多办法可以让您的应用连上数据库。下面会列举各数据库访问框架的适用场景,相信能够帮您选到适合项目的开发框架。JOOQ提供了一种DSL来解决查询问题。这种语言基于生成的entity对象 ...
近日,C++ 之父 Bjarne Stroustrup 接受采访,谈及 C++ 的设计思想,以及 C++ 发展历程的关键转折点。1979 年,还在贝尔实验室的 Bjarne Stroustrup 着手开发 C++ 语言。C++ 的出发点之一是改进 C 语言,增加了面向 ...
工业界的垃圾回收器,一般都是上篇中几种垃圾回收算法的组合实现。下图中列举了最常见及最新的几种垃圾回收器,大多数的垃圾回收器均采用了分代设计(或者适用于分代场景),且一般有固定的搭配使用模式,每种垃圾回 ...
一般情况下,数据都是在数据库中,应用系统直接操作数据库。当访问量上万,数据库压力增大,这个时候,怎么办呢?有小伙伴会说,分库分表、读写分离。的确,这些确实是解决比较高的访问量的解决办法,但是,如果访问 ...
目前企业级的大数据应用主流还是采用Yarn或者Mesos来进行资源分配和运行调度的,例如我行目前采用Yarn来进行作业调度,并使用HDFS作为大数据的存储平台,这是典型的计算和存储紧耦合的模式,这种方案是通过数据本地 ...
服务注册中心本质上是为了解耦服务提供者和服务消费者。对于任何一个微服务,原则上都应存在或者支持多个提供者,这是由微服务的分布式属性决定的。更进一步,为了支持弹性扩缩容特性,一个微服务的提供者的数量和分 ...
2020年11月,DB-Engines 流行度排行已经出炉,本月前十名的位置上,Redis 上升一位,和 Elasticsearch 交换了位置,其他数据库产品位次保持不变。在11月的排行榜上,分数下降的居多,前十位仅有 3个 数据库产品录得 ...
近日,GitHub 安全研究员 Kevin Backhouse 发现了 Ubuntu 20.04(一个长期支持版本)中的漏洞,该漏洞可以使任何桌面用户无需系统密码,即可添加新的 sudo 用户,并获得 root 访问权限。Backhouse 指出,利用该漏洞 ...
Kafka宕机引发的高可用问题,问题要从一次Kafka的宕机开始说起。笔者所在的是一家金融科技公司,但公司内部并没有采用在金融支付领域更为流行的 RabbitMQ ,而是采用了设计之初就为日志处理而生的 Kafka ,所以我一 ...
破解内卷的方法是什么?最简单的是根本不去内卷的行业和领域混,自己开辟一个领域和行业。举个不一定恰当的例子,李诞如果按照自己华南农业大学大部分同学所走的路子,估计也很难逃过内卷,但他进了一个在中国刚开始 ...
几个小时前,Python 之父 Guido van Rossum 宣布了他已经加入微软的消息。去年 10 月,Van Rossum 在 Dropbox 公司工作了六年半后决定退休。在大多数顶级程序员都享受退休生活的时代,现年 64 岁的 van Rossum 决定 ...
Elasticsearch默认被配置为使用单播发现,以防止节点无意中加入集群。组播发现应该永远不被使用在生产环境了,否则你得到的结果就是一个节点意外的加入到了你的生产环境,仅仅是因为他们收到了一个错误的组播信号。E ...
随着生活节奏的加快,工作压力的加大,越来越多的人开始注重健身,如此一来,可穿戴健身追踪设备就变得很流行。如果仔细观察,会发现身边已经有很多朋友开始使用这类设备,或用于健身或用于减肥,这些设备可以记录健 ...
随着云原生技术的蓬勃发展,为各种分布式集群环境的实施提供了非常便利的条件。Elastic Stack是一种非常优秀的分布式搜索解决方案,但是由于其组件较多且有很多配置,因此在搭建集群时存在一定难度。这里我们提供一 ...
Rsync 是一种快速且通用的命令行实用程序,可通过远程shell在两个位置之间同步文件和文件夹。使用 Rsync,可以镜像数据,创建增量备份,并在系统之间复制文件。复制数据时,你可能要根据文件名或位置排除一个或多个 ...
本周最新一期《Nature》期刊,刊载了一种利用原子薄型半导体,设计兼顾逻辑计算和数据存储能力的芯片的方法。通过把两种功能结合于单一芯片结构,这种新型芯片可以更高效地驱动设备,或能用于推动AI方面的研究。这项 ...
随着云原生技术的蓬勃发展,现在科技人员对于学习和使用该新技术有着强烈的需求,但是由于该技术对所使用的软硬件都有较高的要求,一定程度上提高了学习的门槛。虽然采用Minikube也可以搭建环境,但是由于Minikube具 ...
量子力学确实很难以我们日常生活的经验和观察来理解。但这不妨碍我们抽象地领会关于量子力学一些最核心的内涵,形成最基础的“量子化思维”。
为什么很难用日常思维来理解?1900年,当人们欢庆经典物理学大厦已经基 ...
不论是临近毕业的学生,还是已经进入职场的人士,工作的稳定性,对每个人来说,都是很重要的。毕竟,谁都不希望今天入职,不到几个月就得换工作的事情发生在自己身上。能在一份工作上长久坚持,无疑是困难的。幸运的 ...
审核和编写报警规则时,需要考虑以下的这些原则:报警的(电话,短信)触达应当是紧急的,重要的,可行动的,真实的。规则应当表示是你的服务处于过程中或者即将发生的问题。为了保持报警项的精确,有效;宁可过度移 ...
文件系统要解决的一个关键问题是怎样防止掉电或系统崩溃造成数据损坏,在此类意外事件中,导致文件系统损坏的根本原因在于写文件不是原子操作,因为写文件涉及的不仅仅是用户数据,还涉及元数据(metadata)包括 Super ...
在高频交易的世界中,自动化应用程序每天处理数亿个市场信号,并在全球各个交易所发送成千上万的订单。为了保持业务竞争力,响应时间必须始终保持在微秒级,尤其是在黑天鹅异常事件等高峰期。在典型的体系结构中,金 ...
现在每年高考的招生数量都已经超过800万,由于各个专业的毕业生人数不同,企业的需求也不同,所以各个专业的就业率情况也存在着很大的差异。本文就来看下根据教育部以及《人民日报》统计的数据,有8个专业是是被亮红 ...
TIOBE 公布了 2020 年 11 月的编程语言排行榜。Python 已成功跃居榜单第二名,本月排名率为 12.12%;Java 被挤到第三位,排名率降至 11.68%。自有 TIOBE 榜单以来,C 和 Java 之前一直占据着前两名的位置。然而现如 ...
监控作为底层基础设施的一环,是保障生产环境服务稳定性不可或缺的一部分,线上问题从发现到定位再到解决,通过监控和告警手段可以有效地覆盖了「发现」和「定位」,甚至可以通过故障自愈等手段实现解决,服务开发和 ...
在2019年PyTorch开发者大会上,Facebook,Google和Salesforce Research联合宣布启动PyTorch-TPU项目。项目的目标是在保持PyTorch的灵活性的同时让社区尽可能容易地利用云TPU提供的高性能计算。团队创建了PyTorch/XLA ...
AIOps,最初的定义是Algorithm IT Operations,是利用运维算法来实现运维的自动化,最终走向无人化运维。随着技术成熟,逐步确定为Artificial Intelligence for IT Operations——智能运维,将人工智能应用于运维领 ...
平均负载可以对于我们来说及熟悉又陌生,但我们问平均负载是什么,但大部分人都回答说平均负载不就是单位时间内CPU使用率吗?其实并不是这样的,如果可以的话,可以 man uptime 来了解一下平均负载的详细信息。简单 ...
设计模式是在编写代码时在各种不同情况下出现的模式。在本文中,我将讨论 Newtype 设计模式。具体来说,我将以 Rust 编程语言为背景来讨论它,以及如何解决在 Rust 中使用 Newtype 模式时出现的一些问题。编程设计模 ...
Kafka 。业务线从Kafka接数据自己做数据的聚合计算。主要问题在于完全没有数仓的概念,业务线在做大量重复的建设。Spark + ES。每来一个业务需求,就构建一个Spark+ES集群(spark负责计算写入到ES,ES业务层直接使用 ...
用户需求和云的发展两条线推动了云原生技术的兴起、发展和大规模应用。本文将主要讨论什么是云原生应用,构成云原生应用的要素是什么,什么是Serverless 计算,以及Serverless如何简化技术复杂度,帮助用户应对快速 ...
曾有文章称中国近代著名科学家徐寿先生是第一位发表Nature论文的中国人。据称这篇“论文”讨论的是乐器的声学问题,发表在1881年3月10日的Nature。事实是否真的如此呢?我们应读者的要求,对此予以考证,结果有很多 ...
TCP/IP协议模型,包含了一系列构成互联网基础的网络协议,是Internet的核心协议。基于TCP/IP的参考模型将协议分成四个层次,它们分别是链路层、网络层、传输层和应用层。下图表示TCP/IP模型与OSI模型各层的对照关系 ...
“一条慢查询会造成什么后果?之前我一直觉得不就是返回数据会慢一些么,用户体验变差?”其实远远不止,我经历过几次线上事故,有一次就是由一条 SQL 慢查询导致的。那次是一条 SQL 查询耗时达到 2-3 秒「没有命中 ...
洛伦茨是一位气象学家,研究大气物理,曾孜孜不倦地去探索多年来被学术界认为“算不上是科学” (“less than science”)的“长期天气预报”。气象学家甚至普通人都知道,长期天气预报是不精确的:谁知道明年的今天 ...
多版本并发控制 技术的英文全称是 Multiversion Concurrency Control ,简称 MVCC 。是通过保存数据在某个时间点的快照来实现并发控制的。也就是说,不管事务执行多长时间,事务内部看到的数据是不受其它事务影响的 ...
接近传感器在操作中可以进一步分为接触式或非接触式,以及模拟或数字。传感器的选择取决于物理,环境和控制条件。可以采用任何合适的机械/电气开关,但是由于操作机械开关需要一定的力,所以通常使用微型开关。这些 ...
几年前,你在填高考志愿时怀着憧憬填写了电子/半导体物理/微电子专业;在顺利进入大学,并经历了数年的学习后,决定继续出国深造。小编作为当年的出国党之一,希望在这篇文章中把多年来在国内和国外积累的各种相关 ...
1956 年,福特公司上市,成为有史以来最大的 IPO。由于融资规模巨大,这次公开募股,几乎囊括了华尔街的每一家公司,其中就包括巴菲特的伯克希尔哈撒韦。64 年后的 2020 年 9 月,SNOWFLAKE 上市,成为有史以来软件 ...
只要解出薛定谔方程,你就能预测分子的化学性质。但现实很骨感,迄今为止,科学家只能精确求解一个电子的氢原子,即使是只有两个电子的氦原子都无能为力。原因是有两个以上电子组成的薛定谔方程实在太复杂,根本无法 ...
当地时间 10 月 20 日,《自然》的出版方施普林格·自然(Springer Nature)宣布与德国马克斯·普朗克研究所数字图书馆(Max Planck Digital Library, MPDL) 签订一项为期 4 年的开放获取(OA)出版协议:从 2021 ...
老实说,我很喜欢 Java。我在 Spiral Scout 工作的那几年,使用了 EJB2、DB2 和 Oracle 等后端技术,积累了很多软件开发方面的专业知识。过去几年,我转向基于自然语言处理的机器人项目,涉及的技术包括 Spring Boot ...
“Salesforce成为比Siebel更伟大的公司,因为他们彻底改变了CRM。ServiceNow成为比BMC更伟大的公司,因为他们彻底改变了ITSM(IT服务管理)。而Snowflake将彻底改变数仓,以我们从未想过的方式。”这段话来自Snowfla ...
近日,国外用于评分的在线软件提供商 KeepTheScore 猛然发现生产数据库被意外删除,超过 300 块计分牌及相关数据瞬间化为乌有。好在该公司使用的数据库是云托管数据库,云提供商每天都会进行一次自动备份。经历了 5 ...
那是 1983 年,Oracle 还是一家小公司。当时,拉里·埃里森正专注于重写满是 bug 的数据库产品,而计算机教授、后来成为数据库传奇人物的 Michael Stonebraker 正在迎头追赶。在《软件战争》(Softwar)一书中,Matt ...
中国央行的数字人民币已经离我们越来越近了,深圳市民成了第一批尝鲜者。“恭喜您参与的‘礼享罗湖’活动已中签。”这两天,参与前期“礼享罗湖数字人民币红包”的深圳市民中,一部分幸运儿已经陆续收到了中签短信。 ...
操作系统中的 CPU 和主内存(Main memory)都是稀缺资源,所有运行在当前操作系统的进程会共享系统中的 CPU 和内存资源,操作系统会使用 CPU 调度器分配 CPU 时间并引入虚拟内存系统以管理物理内存,本文会分析操作 ...
高等教育评价专业机构软科10月15日正式发布“2020软科中国最好学科排名” 。软科中国最好学科排名采用的学科口径是教育部最新《学位授予和人才培养学科目录》中的一级学科。在每个一级学科,排名的对象是在该一级学 ...
其实很久以前就想谈一谈这个话题了,但是最近才有了足够的动机。因为从最近参加的很多 debrief 来看,我认为身边大多数的软件工程师面试中,在通过技术问题来考察候选人这方面,很多都做得不够好。比方说,我看到一 ...
美国时间 8 月 28 日下午,侵入式脑机接口技术公司 Neuralink 的创始人、科技英雄「硅谷钢铁侠」埃隆-马斯克举行了他戏称为「三只小猪」的发布会。通过「遛猪」的方式,向世界宣布和展示了 Neuralink 团队在过去一年 ...
BERT中及XLNet和RoBERTa中,词嵌入大小 E 和隐藏层大小 H 相等的,H =E=768;而ALBERT认为,词嵌入学习单个词的信息,而隐藏层输出包含上下文信息,应该 H>>E。所以ALBERT的词向量的维度小于encoder输出值维度。 ...
车牌识别是一种图像处理技术,用于识别不同车辆。这项技术被广泛用于各种安全检测中。现在让我一起基于OpenCV编写Python代码来完成这一任务。第一步是从汽车上检测车牌所在位置。我们将使用OpenCV中矩形的轮廓检测来 ...
LSTM 之父、深度学习元老 Jürgen Schmidhuber 发文纪念 10 年前发表的研究。Jürgen Schmidhuber 每次发博客都会引起一阵「腥风血雨」,这次似乎也不例外。最近,这位机器学习大牛发布博客,纪念 10 年前发表在 Neu ...
当前,美国对中国企业、高校和个人的制裁越来越频繁。以这个星期为例,本周三,美国商务部宣布将24家中国企业列入制裁名单;本周五,美国国防部宣布,认定11家中国企业为中国军方拥有或控制,为美出台新一轮制裁铺路 ...
据台媒工商时报援引业界消息,苹果或将配合其首款自研Mac芯片Apple Silicon,推出自研的GPU。这款GPU代号为Lifuka,或将搭载于2021年下半年推出的iMac,与苹果自研的Mac处理器Apple Silicon一样,由台积电5nm制程工 ...
大家都知道现在GPT3风头正盛,然而,到处都是GPT3、GPT3地推,读者是否记得GPT3的论文的名字呢?事实上,GPT3的论文叫做《Language Models are Few-Shot Learners》,标题里边已经没有G、P、T几个单词了,只不过它跟 ...
计算机视觉主要问题有图像分类、目标检测和图像分割等。针对图像分类任务,提升准确率的方法路线有两条,一个是模型的修改,另一个是各种数据处理和训练的技巧(tricks)。图像分类中的各种技巧对于目标检测、图像分割 ...
Transformer模型是机器翻译领域的一个全部基于attention的模型。那么什么是attention呢?且看下图。图中是一个seq2seq+attention的机器翻译模型。机器翻译问题中分为源语言和目标语言,图中是英语到西班牙语的翻译, ...
近日,CMU 的研究人员在 arXiv 上放出了一份技术报告,介绍他们如何通过蒸馏(distillation)训练一个强大的小模型。所提出方法使用相同模型结构和输入图片大小的前提下,在 ImageNet 上的性能远超之前 state-of-the ...
经过一年努力,OpenKG初步完成了底层区块链平台测试,以及OpenKG数据集、工具集和Openbase细粒度知识众包的上链测试工作。在这个测试平台中,已包含1033位确权的知识贡献者。上链测试两个月,累计由真实知识消费者触 ...
实际上,小目标检测是目标检测落地应用中非常棘手的问题,比如经常在遥感/无人机目标检测、人脸检测应用中出现。小目标检测(Small/Tiny Object Detection)概念很好理解,定性分析简单来说就是:相对于图像占比很小 ...
今日凌晨,苹果新一代A14仿生芯片“甩开”历年硬件主角iPhone,首次搭载于苹果新一代平板产品iPad Air上抢跑发布!在此之前,有关A14芯片的行业“剧透”已被曝光了太多,而苹果此次一改iPad系列产品均采用“特别增强 ...
今年的hotchip上marvell展示了其基于ARM架构的Thunder X3服务器芯片。Marvell在fabless厂商中应该算是鼎鼎大名,从硬盘控制芯片起家至今,已经发展成为包含丰富产品线的综合性公司。其中ARM处理器产品线,除了这次展 ...
近几年来,人工智能技术得到了飞速发展,其进展突出体现在以知识图谱(Knowledge Graph)为代表的知识工程和以图神经网络(Graph Neural NetWorks, GNN)为代表的深度学习等相关领域。融合知识图谱与图神经网络已然成为 ...
众所周知,经典的transformer架构中采用了multi-head attention机制来引导模型从不同角度学习不同的语义信息,从各种实验对比中也能发现多头机制确实能够提升模型在NLP任务上的精度。然而,随着目前大规模预训练模型 ...
前几年的“人工智能热”让大小厂商陆续跳入AI芯片的研发大军中,而当这股潮水褪去,当初的50多家公司大多数都黯然退出历史舞台,如今只剩10家左右。AI芯片的风口已然过去。据艾瑞咨询发布的2019年《AI芯片行业研究报 ...
今天,Arm公布下一代Neoverse服务器CPU设计,不仅公布N系列的第二代产品N2,还首次推出了全新产品类别Neoverse V系列平台,剑指最高单线程性能。Neoverse V1内核(代号Zeus)支持可伸缩扩展(SVE),具备更高的单线 ...
随着人工智能技术的发展,智能对话的应用场景越来越多,目前已经成为了研究的热点。天猫精灵,小度小度,腾讯叮当,这些智能助手都是智能对话在业界的应用。智能助手的对话方式可分为三种:任务式对话 ( 用户输入指 ...
今天,英特尔推出新一代移动PC处理器——第11代智能英特尔酷睿处理器,代号Tiger Lake,搭载英特尔锐炬Xe显卡,并首次加入全新SuperFin晶体管技术。据介绍,Tiger Lake的CPU性能提升逾20%,显卡性能提升高达2倍,在G ...
近年来,自监督学习逐渐成为了备受人们关注的应对标注缺乏问题的热门解决方案,科研人员在基于对比学习的自监督方法方面进行了大量研究。本文是 PyTorch Lightning 创始人 William Falcon 的对比学习综述,对自监督 ...
据台媒经济日报透露,台积电2纳米制程研发获重大突破。供应链透露,有别于3纳米与5纳米采用鳍式场效电晶体(FinFET)架构,台积电2纳米改采全新的多桥通道场效电晶体(MBCFET)架构,研发进度超前,业界看好2023年下 ...
近日,NVIDIA 斥资 400 亿美元收购 Arm 的消息疯狂刷屏,看来今年挤爆牙膏的老黄确实够豪横。但很快也有业内人士表达了对此次收购案的担忧,认为立场原本相对中立的 ARM 生态一旦落入 NVIDIA 手中,对整个行业带来的 ...
GPT,全称是Generative Pre-training,顾名思义,就是预训练模型。在GPT出现之前,通用的使用预训练的方式是word2vec,即学习词语的表达。而在GPT出现之后,通用的预训练方式是预训练整个网络然后通过微调(fine-tune ...
最近,在一篇发表于《皇家社会科学学会》期刊上的研究中,来自诺基亚贝尔实验室(Nokia Bell Labs)和罗马大学的三位研究员合力使用AI算法分析了数千个梦,表示AI可以识别并量化梦的特征,特征之间的相互关系,以及 ...
说起绘制空间数据相关的可视化作品,R语言还是比Python 要方便的多的。这里我们就简单介绍下tmap 空间数据可视化绘图包。值得注意的是,tmap 拥有类似于ggplot2 “图层” 语法绘图原理,熟悉ggplot2绘图的小伙伴肯定 ...
在检测行人任务中,由于行人之间互相遮挡,导致传统的检测器容易受遮挡的干扰,给出错误的预测框。研究人员先是从数据集上进行分析,定量描述了遮挡对行人检测带来的影响。后面受吸引,排斥的启发,提出了Repulsion ...
ARM出售案又有新进展,软银出售ARM给英伟达的消息即将尘埃落定,这一交易金额将高达400亿美元。据福布斯今日消息,日本软银集团(SoftBank Group Corp.)准备以超过400亿美元的价格将英国的ARM Holdings销售给美国芯 ...
ReLU是深度学习中很重要的里程碑,简单但强大,能够极大地提升神经网络的性能。目前也有很多ReLU的改进版,比如Leaky ReLU和 PReLU,而这些改进版和原版的最终参数都是固定的。所以论文自然而然地想到,如果能够根据 ...
CNN 和 RNN是当下 Deep Learning 应用领域中主流的两大结构。前篇文章中我们介绍了 CNN,本篇开始我们聊聊 RNN。RNN 跟 CNN 历史相似之处在于,都是上个世纪提出来的概念。但是由于当时计算量和数据量都比较匮乏,它 ...
BERT,全称 Bidirectional Encoder Representation from Transformers,是一款于 2018 年发布,在包括问答和语言理解等多个任务中达到顶尖性能的语言模型。它不仅击败了之前最先进的计算模型,而且在答题方面也有超 ...
英伟达欲以400亿美元的价格从软银手中收购Arm的传言,在9月14日伴随着英伟达与软银联合发布的一则公告而终止。据英伟达公告显示,这笔400亿美元的拟议中的交易要符合惯例成交条件,包括收到英国,中国,欧盟和美国的 ...
光刻胶又称光致抗蚀剂,是一种对光敏感的混合液体。其组成部分包括:光引发剂(包括光增感剂、光致产酸剂)、光刻胶树脂、单体、溶剂和其他助剂。光刻胶可以通过光化学反应,经曝光、显影等光刻工序将所需要的微细图 ...
在过去的十年中,深度神经网络从根本上变革了自然语言处理(NLP)领域的发展,但移动端有限的内存和处理能力对模型提出了更高的要求。人们希望它们可以变得更小,但性能不打折扣。去年,谷歌发布了一种被称为 PRADO ...
去年 9 月,美国军事研究部门 DARPA 启动了一项名为 “ACE” 的 AI 空战计划,旨在借助 AI 算法训练战斗机自主参与空战。如今,这一计划收获了初步成效。据英国科技媒体 The Register 报道,近日,美国军事研究部门 ...
当地时间9月22日,微软在官网发布通告,与OpenAI合作,独家获取了GPT-3语言模型的使用许可。这份通告以微软首席技术官凯文·斯科特(Kevin Scott)的身份发出,称微软正在与OpenAI合作,独家授权GPT-3使用。“这使我 ...
近年来,机器学习(Machine Learning)领域的研究和发展可谓是与日俱新,各式各样与机器学习相关的研究成果与应用层出不穷(如图像识别,自动驾驶,语音识别等),机器学习能够处理的任务也愈发的复杂。但与此同时,新 ...
文章所研究的“跨领域情感分析”,旨在通过源领域的标注数据对目标领域的无标注数据进行情感分类。源领域如餐饮领域,目标领域如电子产品领域,这两个领域之间存在一定的差异。为了克服领域间的差异,一大类工作的思 ...
本文从从老祖级别的 word2vec 开始,从头到尾梳理了 GPT 的 「家谱」 和 word2vec 领衔的庞大的 NLP「家族集团」。GPT 不是凭空而出,它是经过了很多人的努力,以及很长一段时间的演化得来的。因此,梳理一下 GPT 的 ...
文本分类是NLP最常见的应用之一,有了BERT之后更是可以通过小批量数据精调达到不错的效果。但在对速度要求高、没有钱买GPU、移动设备部署的场景下,还是得用浅层网络。今天就跟大家介绍Google最近新出的一个模型—— ...
这些年来,相信各位闲闲没事,就会在网路各角落看到,不同领域的各路英雄好汉一直有相同疑惑:为何今天的x86 处理器市场,台面上只剩下英特尔和AMD 两家美国公司?顶多再加个存在感稀薄的台湾VIA,和少人知悉的俄罗 ...
众所周知,深度学习是一个很吃算力的领域,所以,GPU 选得好不好直接决定了你的炼丹体验。那么,哪些指标是你在买 GPU 时应该重视的呢?RAM、core 还是 tensor core?如何做出一个高性价比的选择?文本将重点讨论这 ...
Transformer架构在机器学习领域(尤其是NLP里)是一项热门研究,为我们带来了许多重要成果,比如:GPT-2、GPT-3等写稿机器人;第一代GPT及其性能更优越的“继任者”BERT模型,在众多语言理解任务中以前所未有的数据 ...
在CPU芯片领域,延续至今的“摩尔定律”正在随着制程工艺逼近物理极限而有了延缓的趋势,甚至失效的可能。就在摩尔定律的增长放缓脚步的同时,半导体芯片的计算也正在从通用走向专用,其中AI计算正是其中增长最快的 ...
协同过滤是基于用户行为设计的推荐算法,具体来说,是通过群体的行为来找到某种相似性(用户之间的相似性或者物品之间的相似性),通过相似性来为用户做决策和推荐。从字面上理解,协同过滤包括协同和过滤两个操作。 ...
英特尔一统服务器芯片江湖已经很久了。虽然在这期间有IBM和MIPS前来挑战,但他们谁都无法撼动英特尔的地位。进入了二十一世纪以后,凭借移动领域而迅速崛起的Arm,为“高处不胜寒”的英特尔增添了一丝火热——Arm开 ...
今年6月,OpenAI发布一款强大的文本生成模型GPT-3,不少网友迅速上手用了起来,有人用它写食谱、写歌词,甚至有人用它写博客,愣是以假乱真登上了新闻平台技术板块热榜第一。前不久,OpenAI再次放出大招。这次,研究 ...
kafka是一个分布式消息队列。具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消息,消费者从队列里取消息进行业务逻辑。一般在架构设计中起到解耦、削峰、异步处理的作用。kafka对外使用topic的概 ...
应用程序部署在操作系统上,定时任务依赖操作系统的时钟。鉴于大部分的服务器都部署在 Linux 上,我们就只讨论 Linux 的时间系统,Windows 服务器别打我。大部分 PC 机中有两个时钟源,他们分别叫做 RTC(Real Time ...
Application scorecard 进件评分卡,对授信阶段提交的资料赋值的规则。举例:“进件”是传统银行的说法,指申请单。评分卡是对一系列用户信息的综合判断。随着可以收集到的用户信息变多,授信决策者不再满足于简单的 ...
现有的AI产业基数和舆论、资本对它助推是并不对等的,其中泡沫确实存在。事涉AI则必强大绝对是一种盲目的价值观。但AI的优势在于这种基数近乎于无限底层,能够提供的应用场景过分巨大,所以在众多应用场景没有被验证 ...
YOLO没有显示求取region proposal的过程。Faster R-CNN中尽管RPN与fast rcnn共享卷积层,但是在模型训练过程中,需要反复训练RPN网络和fast rcnn网络.相对于R-CNN系列的"看两眼"(候选框提取与分类),YOLO只需要Lo ...
我们都知道预训练模型的标准范式:pretrain-利用大量的未标记数据通过一些自监督的学习方式学习丰富的语义和句法知识。例如:Bert 的 MLM,NSP 等等。finetune-将预训练过程中所学到的知识应用到子任务中,以达到优 ...
最早的GNN主要解决的还是如分子结构分类等严格意义上的图论问题。但实际上欧式空间(比如像图像 Image)或者是序列(比如像文本 Text),许多常见场景也都可以转换成图(Graph),然后就能使用图神经网络技术来建模。2009 ...
Snowflake 在2018年成为福布斯的云服务100 排行榜,成为全领域发展最快的云解决方案之一。Snowflake是“作为软件即服务(SaaS)提供的数据分析仓库。”让Snowflake爆炸性增长的一些功能是并发性无限,快速且具弹性, ...
Uber 的早期架构包含了一个用 Python 开发的单体后端应用程序,这个应用程序使用 Postgres 作为数据存储。从那个时候开始,Uber 的架构已经发生了巨大变化,变成了微服务,并采用新的数据平台模型。具体地说,之前使 ...
监控系统某个指标超过阈值,触发告警。大半夜里,你被紧急召唤。半睁着眼,你满脸疑惑:“系统真出问题了吗,还是仅仅需要调整下告警?上一次有人调整我们的告警阈值是在什么时候?有没有可能是上游或者下游的服务出 ...
微服务为了把业务完美拆解,把原来的同一个进程里的模块拆分成不同的服务,显著增加额外的网络开销。更别说什么Service Mesh,各种Gateway,Proxy,Sidecar简直就是担心延迟太低。微服务基本只有request/response的 ...
没有顶尖的光刻机,是我国半导体行业发展的最大瓶颈。在这个领域称得上龙头的,荷兰的阿斯麦尔(ASML)首屈一指。10月14日,ASML的首席财务官Roger Dassen就向中国出口光刻机的问题发表了口头声明。他说,与中芯国际等 ...
由于某些国家/地区的知识产权保护和执法有限,因此 JDK 源代码只能分发到授权的国家/地区列表中。如果要从不在此列表中的国家/地区进行下载,则将无法访问源代码。我们正在不断审查此列表,以添加其他国家/地区。有 ...
1873年,科学家约瑟·美(Joseph May)及伟洛比·史密夫(WilloughbySmith)就发现了硒元素结晶体感光后能产生电流,由此,电子影像发展开始,随着技术演进,图像传感器性能逐步提升。光电倍增管(简称光电倍增管或PMT) ...
Elasticsearch 默认被配置为使用单播发现,以防止节点无意中加入集群。组播发现应该永远不被使用在生产环境了,否则你得到的结果就是一个节点意外的加入到了你的生产环境,仅仅是因为他们收到了一个错误的组播信号。 ...
数学家会代码,就连困扰人类90年的数学猜想也挡不住。来自斯坦福、CMU等高校的4名数学家,直接将一个数学难题转化成了对10亿个结果进行“暴力搜索”。他们把这串代码输入40台电脑组成的计算集群,30分钟后,计算机给 ...
一直都知道,美国的程序员薪资非常高,但前不久美国的科技猎头公司 Hired 发布了最新的《全美程序员薪水调查报告》,美国旧金山湾区作为众多科技巨头(如Google,Facebook)的大本营,以平均年收入14.2万美金的成绩 ...
为什么这个时候我会提到 Haskell?好吧,Haskell 和 Rust 有着千丝万缕的联系。可以说,Rust 就是没有高阶类型(HKT)的 Hashkell。Rust 的很多风格与 Haskell 很像。在某种程度上,可以说 Rust 就是 Haskell 的化身 ...
云里面的每个白色正方形的盒子代表一个节点——Node。在一个或者多个节点直接,多个绿色小方块组合在一起形成一个ElasticSearch的索引。在一个索引下,分布在多个节点里的绿色小方块称为分片——Shard。一个ElasticS ...
我们发生了数据丢失的严重事件:在部分机架中,约有 2% 的设备因意外操作失误而经历了镜像重装。而问题的根源在于,我们的 Hadoop 基础设施主机生命周期管理体系存在设计错误。更糟糕的是,这一切发生在 LinkedIn 的 ...
假设现在公司有一个需求,目前公司的数据量很大,需要每天出一个报表且输出到业务数据库中。首先是刚入库的业务数据,大致分为两种,一种是 MySQL 的 binlog,另外一种是业务系统中的业务打点,这个日志打点信息可以 ...
一个大型的分布式系统,通常都会异步化,走消息总线。 消息队列作为最主要的基础组件,在整个体系架构中,有着及其重要的作用。异步通常意味着编程模型的改变,时效性会降低。kafka是目前最常用的消息队列,尤其是 ...
近期,中国电科集团电科院开展了陆空协同固定翼无人机“蜂群”系统的相关试验试飞工作,验证了陆上发射和空中投放固定翼无人机“蜂群”开展对地察打、精确打击等各项任务能力。相比于旋翼/多旋翼无人机,固定翼无人 ...
微软 .NET 官方博客近日发布了一篇谈论 .NET Standard 未来的文章。文章作者是 .NET 项目经理 Immo,他在文章中指出未来 .NET Standard 将会被 .NET 5 取代,还对 .NET 5 如何改进代码共享以及取代 .NET Standard 这 ...
Windows 是商业软件,这使它具备易用的性质。Linux 是自由软件,这使得它拥有开源的性质。易用软件通常带来的是对用户的友好度,以致于 Windows 发展至今,被许许多多的普通用户所采用。自由软件通常带来的是其社区 ...
上个月微软宣布正在与 OpenAI 合作,并取得了 GPT-3 语言模型的独家授权许可。其实去年七月,微软向 OpenAI 投资了 10 亿美元,达成伙伴关系。作为交换,OpenAI 同意将其部分知识产权授予微软,然后由微软打包出售。 ...
人类的历史可以看做一部关于解放的历史。也有这样的说法,懒惰是人类进步的动力。为了偷懒,人类不断的做着各种努力,发明了各种机器工具,将自己从繁重的劳动解放出来,另一方面,每一次大的进步,都需要解放思想, ...
中国SCI论文发表数量位列世界第二,但超90%发表在国外期刊;中文期刊的影响因子逐年提高,但95%中文期刊获差评;对比国际期刊的“秒回”,一些中文期刊的审稿时间长达9个月;对比国际期刊全文刊载,不少中文期刊吝啬 ...
近日,253 封发表于 2014 年的 Debian 项目内部讨论邮件在外网被泄露并引起了诸多关注。据这些邮件内容显示,彼时,Linus Torvalds 在 DebConf 会议上的言行引发了一些争议。一些人认为,Linus 在发言中将 FSF 描述 ...
为了庆祝 Java 25 周年和 Java 15 版本的发布,JetBrains 从多个来源收集了数据,以查看该语言当下的发展状态。首先,他们对大多数 Java 开发人员的区域分布进行了调查。据市场研究和分析团队的开发者估计模型指出, ...
边缘AI发源于边缘计算。边缘计算也称为边缘处理,是一种将服务器放置在本地设备附近网络技术, 这有助于降低系统的处理负载,解决数据传输的延迟问题。这样的处理是在传感器附近或设备产生数据的位置进行的,因此称之 ...
深度学习是一个广阔的领域,它围绕着一种形态由数百万甚至数十亿个变量决定并不断变化的算法——神经网络。似乎每隔一天就有大量的新方法和新技术被提出来。不过,总的来说,现代深度学习可以分为三种基本的学习范式 ...
监控是整个运维乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供详实的数据用于追查定位问题。目前业界有很多不错的开源产品可供选择。选择一款开源的监控系统,是一个省时省力、效率最高的方案 ...
随着时间的流逝,程序员们发现了更新、更简单的工作方式,新的编程语言如雨后春笋般出现,但只有少数编程语言能成为社区的新宠。这种进步的一个副作用是一些古老的编程语言必然会跟历史一样被人们遗忘。如果一个编程 ...
机械硬盘(Hard Disk Drive、HDD)和固态硬盘(Solid State Drive、SSD)是两种最常见的硬盘,作为计算机的外部存储,CPU 想要访问它们存储的数据需要很长时间。虽然磁盘的寻道时间只需要 10ms,但是在 CPU 看来已经 ...
那是 1983 年,Oracle 还是一家小公司。当时,拉里·埃里森正专注于重写满是 bug 的数据库产品,而计算机教授、后来成为数据库传奇人物的 Michael Stonebraker 正在迎头追赶。在《软件战争》(Softwar)一书中,Matt ...
随着业务的迅猛增长,Yandex.Metrica目前已经成为世界第三大Web流量分析平台,每天处理超过200亿个跟踪事件。能够拥有如此惊人的体量,在它背后提供支撑的ClickHouse功不可没。ClickHouse已经为Yandex.Metrica存储了 ...
缓存在计算机系统是无处不在,在CPU层面有L1-L3的Cache,在Linux中有TLB加速虚拟地址和物理地址的转换,在浏览器有本地缓存、手机有本地缓存等。可见,缓存在计算机系统中有非常重要的地位,其主要作用是提高响应速 ...
某日下午大约四点多,接到合作方消息,线上环境,我这边维护的某http服务突然大量超时(对方超时时间设置为300ms),我迅速到鹰眼平台开启采样,发现该服务平均QPS到了120左右,平均RT在2秒多到3秒,部分毛刺高达5到 ...
Redis作为内存数据库,拥有非常高的性能,单个实例的QPS能够达到10W左右。但我们在使用Redis时,经常时不时会出现访问延迟很大的情况,如果你不知道Redis的内部实现原理,在排查问题时就会一头雾水。很多时候,Redis ...
作为开发人员,在当今这个技术更迭飞快的时代要连年吃香并非易事,很多十年开发经验以上的开发人员不知道经历了多少语言的变化,今年还在用C语言,下一年就是D了。“PHP是世界上最好的编程语言”已被人忘却,但“青 ...
老实说,我很喜欢 Java。我在 Spiral Scout 工作的那几年,使用了 EJB2、DB2 和 Oracle 等后端技术,积累了很多软件开发方面的专业知识。过去几年,我转向基于自然语言处理的机器人项目,涉及的技术包括 Spring Boot ...
从去年九月,Linux 内核维护者 Greg 表示愿意接受用 Rust 开发 Linux 驱动,到今年七月,Linus Torvalds 回应称可以默认启用 Rust 支持,Linux 开发者并非只是说说而已。在八月底举办的 2020 Linux Plumbers 大会上 ...