InfoQ中文版

2019-09-16 02:43    2019-09-16 05:34

微软的薪资泄露表明,员工为更高的薪酬所做的抗争

这些数字从4万美元到32万美元不等,揭示了大型科技公司薪酬运作的关键细节。图片:Stephen Brashear/Getty近400名微软员工正在互相分享工资,以更好地确定他们是否得到了公平的报酬。这一努力源于Facebook上一个名为“年轻的微软FTE”(Young Microsoft FTE)的私人群组,全职员工(Full Time Employees,FTEs)聚集在这里讨论公司。他们有一个共享的谷歌电子表格中收集工资情况。“分享你的匿名信息,这样我们就都能一起得到更多的报酬。”表格开头的一个标题这样写道。这份电子表格详细分析了微软部分员工的薪酬分配情况。

一名成功开发者所需的5项软技能

硬技能的高度决定一个人能否完成某项任务,而软技能则会决定一个人成就某项事业的潜力。软技能一词通常难以理解。软技能又称非技术技能,指沟通能力、倾听能力、说服能力、自我激励能力、影响力、团队建设的能力等等。软技能是各种行为的组合。衡量信念的方法是判断它对态度和行为的影响。硬技能以及少许的智力因素都属于附加的软技能。软技能并不像其他技能那样扎实和清晰。那么作为软件开发者,有哪些必知的软技能呢?软件开发是一项团队运动,但软技能确实也很重要。什么是软技能?如果我们去查阅《牛津词典》,将会得到如下定义:“个人属性,使某人能够有效地与他人进行和谐的互动。

A13芯片很牛,但是这款神秘的U1芯片才是苹果的野心

北京时间2019年9月11日凌晨,苹果公司公布了iPhone 11与iPhone 11 Pro系列手机。虽然在舞台上没有直接提到,但Phil Schiller在演讲期间使用的Apple Pay演示文稿中,赫然出现了全新的苹果U1芯片。而且相信绝大多数朋友,实际是在后来的回放中注意到这一点的。这个似乎是“技术失误”的小细节引起了本文作者的关注,他以此为线索进行了一番挖掘,结果竟然发现了苹果在超宽带无线电技术领域的野心。

人工智能是否被过分高估? | 话题

来自CB Insights的统计,2017年全球范围内有152亿美元的投资被投入到AI领域,其中,中国公司吸引到的投资为73亿美元,占全球比重达48%,位列第一。而2016年,这个比重还仅有11.3%(约7亿美元)。“16、17年,几乎整个投资圈都在聊AI。天使轮的项目投资人看看方向、团队,聊一聊即便就定了,很多公司什么都没有,一个PPT只要带上AI也能拿到不错的估值。”一位AI业内人士表示,而绝大多数AI算法的开源也在一定程度上降低了人工智能行业的进入门槛。虽然资本蜂拥而至,但所见的收益却微乎其微。由于技术本身的制约、自身造血能力不足以及商业模式尚未成型,AI公司短期内还很难看到盈利的可能。

17万条人脸数据遭公开售卖;什么值得买辟谣删库跑路新闻;Oracle修改JDK下载要求丨Q新闻

本周新闻合集: 苹果发布 iPhone 11,游戏和电视订阅服务每月 4.99 美元;美国 40 多个州启动对 Google 的反垄断调查;Oracle 修改 JDK 下载要求:必须登录;什么值得买回应服务中断:服务器遭大面积攻击已报案;17 万条人脸数据遭公开售卖;Flutter 1.9 稳定版发布;GitHub 升级到 Rails 6.0。科技公司苹果发布 iPhone 11,游戏和电视订阅服务每月 4.

在数据科学领域,Rust会是Python的最佳替代方案吗?

在本篇文章中,作者将在Rust上移植一个简单的神经网络实现。他的目标是探索Rust中的数据科学工作流在性能和工程学上的表现。Python实现第一章描述了一个非常简单的单层神经网络。这个神经网络可以使用基于随机梯度下降的机器学习算法,对来自于MNIST数据集的手写数字进行分类。这听起来挺复杂,这些东西也确实在上世纪80年代中期是最先进的,但是实际上,这全部是由一段150行的Python代码做出来的,而且这些代码有很多人评论过。如果你已经知道了这一节的内容(神经网络基础知识),那么我建议你可以跳过去,当然如果想再复习一下神经网络的基础知识也是可以看这一节的。

现在可以借助GDB和LLDB在浏览器外调试WebAssembly源代码了

Mozilla最近展示了如何使用像GDB和LLDB这样的标准调试器在浏览器之外调试WebAssembly二进制文件。在与生产环境相同的执行环境中调试WebAssembly代码,使开发人员可以捕获并诊断相同代码在本地构建时可能不会出现的Bug。WebAssembly加上WASI使得在浏览器之外使用WebAssembly取得了长足的进步,并兑现了“编写一次,到处运行”的承诺。虽然已经可以在浏览器之外运行WebAssembly程序了,特别是在wasmtime中,但调试过程还存在一些困难。虽然WASI允许开发人员使用控制台日志报告程序执行情况,但源代码无法调试。

Serverless 系列文章(三):开发者工具建设

由于 Serverless 平台具备弹性扩缩、免运维、按需付费等特点,越来越多的公司和个人开始使用 Serverless 承载项目。但对于开发者而言,Serverless 一定程度上减少了开发难度,可以让我们聚焦业务逻辑进行开发;但同时,由于 Serverless 颠覆了传统的开发模式,从而在相关的开发工具,函数编排组织上也面临着重大挑战。本文会介绍 Serverless 生态下的开发者工具,并简述这些工具是怎样贯穿开发,调试,测试,部署的生命周期,提升开发者效率。面向 Serverless 开发的挑战从一个开发者的角度而言,Serverless 开发和传统的开发方式相比发生了很大的改变。

系统架构系列(七):如何从开源项目中汲取架构思维?

在上一篇文章中提到技术架构等于解决业务上的技术问题加技术方案加技术组件。其中,技术组件是物理基础,当下也有很多开源的中间件,最核心的是技术方案,它是灵魂。笔者认为技术架构如同中医一样,药材是基础,而药方才是最核心的,药方好比技术方案。本篇文章中,以笔者的一些经历,从经典源码中汲取架构的一些思想,同大家分享。一、阅读经典源码的层次境界1.1 架构类比中医中医在成长过程中,从识药开始,再读经典著作学习药方,到临床实践,最后通过自己的总结,创新某类药方,进行裁剪和扩充。大医以某一个药方就能闻名于世,所以这些也给我们技术人某些启示。

计算机原理介绍:微处理器与总线部分

微处理器(CPU)是计算机系统的核心部件,控制和协调着整个计算机系统的工作。微处理器主要具有以下功能:能够进行运算,主要是算术运算和逻辑运算;能对指令进行译码,寄存并执行指令所规定的操作;具有与寄存器和I/O接口进行数据通信能力;少量数据的暂时储存;能都提供这个系统的所需要的控制信号以及定时;能够响应输入或者输出设备发出的中断请求。这些对CPU进行了大致概括,我们会在接下来的几章中,着重对CPU的一些功能进行详细介绍。本文首先说下字长,字长是CPU在同一时间内能够一次处理的二进制位数,通常是指CPU内部寄存器的位数以及数据总线的位数,比如开发人员经常听到的32位、64位就是指字长。

W3C首次发布小程序标准化白皮书,小程序要实现统一了吗?

2019年9月12日,W3C首次公开发布了小程序标准化白皮书,该文档介绍了这种非常流行的混合解决方案,既依赖Web技术,也集成了原生应用的功能。此标准一出,各家小程序将来有望实现统一吗?文档状态本节介绍本文档发布时的状态。本文档可能会被其他文档取代。可以W3C技术报告索引中找到W3C当前发布列表和本技术报告的最新版本。目前这项工作仍在推进中。该提案正在W3C中文Web兴趣小组中孵化。本文档由中文Web兴趣小组作为首次公开的工作草案发布。GitHub问题列表是讨论本规范的首选场所。或者你可以向我们的邮件列表发送评论。请将它们发送至public-chinese-web@w3.org。

微软为将ExFAT纳入Linux内核扫清了道路

微软将免费提供exFAT的官方规范,此举意味着exFAT驱动程序将直接包含在Linux内核中。此外,一个支持exFAT的Linux内核将要发布,微软也会在Open Invention Network的Linux系统定义中提供支持。让Linux社区能够放心使用包含在Linux内核中的exFAT,对于我们来说很重要。为此,我们将公开微软的exFAT技术规范,以便开发符合标准的、可互操作的实现。

代码质量提升之道——代码覆盖率原理与移动端工程实践

一、背景介绍随着项目迭代的不断深入,工程逻辑与用户场景日益复杂,传统的白盒测试体系已经无法适应苛刻的工程质量要求,因此有必要针对工程质量进行精细化管理。质量评估不再单纯依赖bug率和性能指标,而是通过精准的数据来量化代码质量,代码覆盖率就是其中的一项重要标准。简单来说,代码覆盖率就是单元测试或者UI测试过程中对于被测代码的覆盖程度,可分为以下三种度量方式:StatementCoverage:最基础的一种覆盖方式,用以度量被测代码中每个可执行语句是否都被执行。

微博2亿日活背后,广告系统不掉线的全景运维大法

本文由 dbaplus 社群授权转载。一、前言微博现在日活达到了2亿,微博广告是微博最重要且稳定的收入来源,没有之一,所以微博广告系统的稳定性是我们广告运维所有工作中的重中之重。微博广告的运维主要负责资产管理、服务稳定性维护、故障应急处理以及成本控制等多个责任。微博广告运维发展经历了如下阶段:从早期小规模的手工运维到工具化运维,随着服务器数量的发展,业务模型日渐发展,开发、运营、QA都参与到产品的生命周期中,我们现在也进入了自动化运维的阶段,在新的虚拟化技术、算法技术的驱动下,我们也在朝着AIOps的方向努力。

新一代联邦学习技术及应用实战

联邦学习背景介绍首先和大家分享下联邦学习的背景。1. AI 落地的理想与现实我们知道 AI 落地的时候,会遇到很多现实的问题:现实中,我们的数据质量是非常差的,比如聊天数据中有很多噪音;数据标签,收集是比较困难的,很多场景中的数据是没有标签的;数据是分散的,(这也是最重要的一点)每家应用的数据不一样,比如腾讯用的是社交属性数据,阿里用的是电商交易数据,微众用的是信用数据,都是分散来应用的。现实中,如何进行跨组织间的数据合作,会有很大的挑战。2.

什么是真正的10x工程师?

不久以前,有一条Twitter引起轰动,它谈及到初创团队应该招聘“10x程序员”并列举出寻找的11个方法。10x程序员初创人员,如果你曾遇到过这类稀有的工程师,吸纳他们。如果有一个10x程序员成为你的第一批少数工程师的一员,那么创业的成功概率会极大的增加。问题是:怎么标识出10x程序员呢?— Shekhar Kirani (@skirani) 2019年7月11日有“10x工程师”和怎样找到他们,这两者是不同的。针对这两点,我需要指出,评估开发人员的表现非常困难,但我相信的确有“10x工程师”。也就是说, 这篇Twitter后面提到的评估准则几乎都没有实用性。点击查看原文>

Greenplum :基于 PostgreSQL 的分布式数据库内核揭秘(上篇)

本文经授权转载自公众号PostgreSQL中文社区,主要介绍了Greenplum 集群概述、分布式数据存储和分布式查询优化。一、数据库内核揭秘Greenplum 是最成熟的开源分布式分析型数据库(今年6月份预计发布的 Greenplum 6 之OLTP性能大幅提升,将成为一款真正的HTAP数据库,评测数据将于近期发布),Gartner 2019 最新评测显示 Greenplum 在经典数据分析领域位列全球第三,在实时数据分析领域位列并列第四。两个领域中前十名中唯一一款开源数据库产品。这意味着如果选择一款基于开源的产品,前十名中别无选择,唯此一款。Gartner 报告原文。

PostgreSQL 变更事件捕获 (CDC)

本文经授权转载自公众号PostgreSQL中文社区。CDC与ETL数据库在本质上是一个状态集合,任何对数据库的变更(增删改)本质上都是对状态的修改。在实际生产中,我们经常需要把数据库的状态同步到其他地方去,例如同步到数据仓库进行分析,同步到消息队列供下游消费,同步到缓存以加速查询。总的来说,搬运状态有两大类方法:ETL与CDC。ETL(Extract Transform Load)着眼于状态本身,用定时批量轮询的方式拉取状态本身。CDC(Changing Data Capture)则着眼于变更事件,以流式的方式持续收集状态变化事件(变更)。

Puppet 监控速查手册:问题 / 原因→解决方案

Puppet是基于C/S架构的集中配置管理系统,基于自有描述性语言,可以实现对配置文件、用户、定时任务、软件包、系统服务等管理,保证大规模集群基础配置一致性。我们用Puppet管理了上千台服务器,经过多次优化监控,自动化灰度发布保证了所有集群基础配置一致性。本文探讨了如何对Puppet系统进行监控,也将典型问题和解决方案一并分享给大家。监控选型Foreman提供了较全面的交互设施,包括Web前端、CLI和RESTful API。在此基础之上,可以构建监控管理系统,以及实现报警等功能。

HDFS监控背后那些事儿,构建Hadoop监控共同体

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。在大数据生态圈中,HDFS是最重要的底层分布式文件系统,它的稳定性关乎整个生态系统的健康。本文介绍了HDFS相关的重要监控指标,分享指标背后的思考。

10个不为人知的SQL技巧

从早期开始,编程语言设计者就有这样的愿望:设计一种语言,在这种语言中,告诉机器我们想要的结果是什么(WHAT),而不是如何(HOW)获得结果。SQL可以做到这点。在SQL中,我们不关心数据库是如何检索信息的,就可以得到结果。本文介绍了使用声明式SQL10个不为人知的技巧。介绍为了理解这10个SQL技巧的价值,首先需要了解下SQL语言的上下文。为什么我要在Java会议上讨论SQL呢?(我可能是唯一一个在Java会议上讨论SQL的了)下面讲下为什么:从早期开始,编程语言设计者就有这种的愿望:设计一种语言,在这种语言中,告诉机器我们想要的结果是什么(WHAT),而不是如何(HOW)获得结果。

弥合AI大规模落地的巨大缺口!阿里、腾讯、百度等联合推出互联网服务AI基准

现如今,互联网服务正经历着根本性的变化,并逐渐转向智能计算时代。现代互联网服务提供商普遍采用人工智能来增强其服务。在这种背景下,研究人员提出了许多创新的人工智能算法、系统和架构,因此基准(benchmark)和评估基准的重要性也随之上升。然而,现代互联网服务采用基于微服务的体系结构,由多种模块组成。这些模块的多样性和执行路径的复杂性、数据中心基础设施的庞大规模和复杂层次结构、数据集和工作负载的保密问题对设计基准提出了巨大挑战。这篇论文中,百度、阿里、腾讯等几家顶级互联网服务提供商联合中国的17个互联网企业共同推出了第一个具有行业标准的互联网服务AI基准——AIBench。

Waymo共享用于机器学习的自动驾驶数据集

自动驾驶技术公司Waymo(该公司归谷歌母公司Alphabet所有)发布了一个数据集,其中包含自动驾驶汽车在5个多小时的驾驶过程中收集到的传感器数据。该数据集包含了激光定位器和摄像头在多个城市和郊区环境的多种驾驶条件下收集的高分辨率数据,其中还包含车辆、行人、骑行者和路标的标签。Waymo团队在一篇博文中宣布发布Waymo Open Dataset,并称其为“有史以来发布的最大、最丰富和最多样化的研究用自动驾驶数据集之一”。这些数据是由Waymo在美国凤凰城、阿兹州、柯克兰、西弗吉尼亚州、山景城、加利福尼亚州和旧金山市的车辆在不同时间、不同天气情况下收集的。

阿里巴巴资深技术专家雷卷:值得开发者关注的 Java 8 后时代的语言特性

首先我们必须承认,Java 8 是一个里程碑式的版本,这个相信大多数Java程序员都认同,其中最知名的是 Streams & Lambda ,这让 Functional Programming 成为可能,让 Java 换发新的活力。这也是即便 Oracle 不在支持 Java 8 的更新,各个云厂商还是积极支持,站点为 https://adoptopenjdk.net/,可以让 Java 8 能继续保留非常长的时间。目前非常多的同学日常开发并没有切换到 Java 8 后续的版本,所以这篇文章,我们打算写一个后 Java 8 时代的特性,主要是偏向于开发的,不涉及 GC ,

基于NVMe SSD的分布式文件存储UFS性能提升技术解析

为了应对 IO 性能要求很高的数据分析、AI训练、高性能站点等场景,UFS团队又推出了一款基于 NVMe SSD介质的性能型UFS,以满足高IO场景下业务对共享存储的需求。性能型 UFS 的4K随机写的延迟能保持在 10ms 以下,4K随机读延迟在5ms以下。性能的提升不仅仅是因为存储介质的升级,更有架构层面的改进,本文将从协议、索引、存储设计等几方面来详细介绍性能型UFS升级改造的技术细节。协议改进此前容量型UFS设计时支持的协议为 NFSv3,其设计理念是接口无状态,故障恢复的逻辑简单。此外NFSv3 在Linux和Windows上被广泛支持,更易于跨平台使用。

作为初创公司的第一位数据工程师,我从中学到了什么

一个没有数据工程经验的人成了一家初创公司的第一位数据工程师,这是一项艰巨的挑战,但回报也是很可观的。公司在招人的时候不仅要找到合适的人,还要让他们相信加入公司是正确的选择。当我收到EmCasa公司的面试邀约的时候,我是另外一家公司的数据科学家。他们想找一位可以帮助他们组织数据的人。我问他们现在已经有哪些数据了,他们真诚地回答我:“我们只有PostgreSQL数据库里的几张表,还尝试使用了一些BI工具,仅此而已”。

为什么时至今日编码面试依然这么糟糕?

“我们有90%的工程师在用你写的软件,但你不能在白板上写出反转二叉树的代码实现,所以你被拒了!”Homebrew的创始人Max Howell在2015年的这条推特吐槽了谷歌的编码面试,收到了1万多个赞,引发了热烈的讨论。但是一直到2019年的现在,编码面试仍然在互联网面试中占据重要地位,一直被吐槽,从未被动摇。本文作者曾是一名经历编码面试被拒的候选人,后来又成为了一名Facebook的编码面试官,他在文中分享了这种视角的变化,深入分析了编码面试占据重要地位的原因和一些改进的想法。你很紧张。电话面试即将开始。这可能是你今年获得理想工作的唯一机会。

2019年,这8款自动语音识别方案你应该了解!

基于计算机的人类语音识别与处理能力,被统称为语音识别。目前,这项技术被广泛用于验证系统中的某些用户,以及面向谷歌智能助手、Siri或者Cortana等智能设备下达指令。从本质上讲,我们通过存储人声与训练自动语音识别系统以发现语音当中的词汇与表达模式。在本文中,我们将一同了解几篇旨在利用机器学习与深度学习技术解决这一难题的重要论文。Deep Speech 1: 实现端到端语音识别的向上扩展本文作者来自百度研究所的硅谷人工智能实验室。Deep Speech 1不需要音素字典,而是使用经过优化的RNN训练系统,旨在利用多个GPU实现性能提升。

Java字节码增强探秘

1. 字节码1.1 什么是字节码?Java之所以可以“一次编译,到处运行”,一是因为JVM针对各种操作系统、平台都进行了定制,二是因为无论在什么平台,都可以编译生成固定格式的字节码(.class文件)供JVM使用。因此,也可以看出字节码对于Java生态的重要性。之所以被称之为字节码,是因为字节码文件由十六进制值组成,而JVM以两个十六进制值为一组,即以字节为单位进行读取。在Java中一般是用javac命令编译源代码为字节码文件,一个.java文件从编译到运行的示例如图1所示。

Apache Beam 架构原理及应用实践

Apache Beam 是什么?1. Apache Beam 的前世今生大数据起源于 Google 2003年发布的三篇论文 GoogleFS、MapReduce、BigTable 史称三驾马车,可惜 Google 在发布论文后并没有公布其源码,但是 Apache 开源社区蓬勃发展,先后出现了 Hadoop,Spark,Apache Flink 等产品,而 Google 内部则使用着闭源的 BigTable、Spanner、Millwheel。

Cellery:向Kubernetes部署应用程序的代码优先方法

本文要点尽管微服务架构(MSA)有很多好处,但管理数百个松耦合的微服务很快就会变得很麻烦。这就是设计基于单元格的架构(CBA)的原因。CBA是一种微服务架构模式,它的主要要求是将多个微服务(及其他组件)分组成称为单元格的构建块,以方便管理和重用。从零开始在容器编排平台上创建CBA很费力。在撰写本文时,Kubernetes是业界广泛采用的容器编排平台;然而,使用YAML编写用于此目的的Kubernetes工件并不是一项简单的任务。Cellery遵循代码优先的方法,处理实现CBA的底层复杂性。Cellery包含一个SDK、一个运行时和一个管理框架。

82天突破1000star,项目团队梳理出软件开源必须注意的8个方面

一、开发在开源项目的开发过程中要注意以下几点:首先,要给自己的项目取一个合适的名字,取名规则这里不再赘述,需要强调的一点是:项目名称不能与GitHub上已开源过的项目名称相同。其次,选择合适的编程语言。再次,编码过程中要注意代码的规范。最后要说的就是开源协议的选择了,目前最流行的开源协议有以下六种:GPL、BSD、MIT、Mozilla、Apache和LGPL。不同的开源协议之间的差别还是挺大的,具体如何选择,可以参考一张图看懂开源协议(https://blog.csdn.

eBay PB级日志系统的存储方案实践

CAL(Central Application Logging) 系统主要负责收集和处理eBay内部各个应用程序池的日志,日处理超过3PB的数据,供运维团队和开发团队日常监控使用。CAL系统通过HTTP接口接受应用产生的日志,将日志持久化到经NFS挂载的网络存储上, 用户(运维团队和开发团队)可以通过CAL系统方便地查找、查看日志。同时,日志也会被导入Hadoop进行进一步的分析形成报告。该系统自21世纪初至今,已经有10多年的历史了。CAL从第一天起就运行在Netapp的商业存储上。

一行命令导致的数据丢失,阿里工程师是如何恢复的?

一、摘要相比于传统的连续数据保护等的解决方案,需要在Guest OS 层面或者在专有的存储层面,进行写时数据变化日志的获取,或多或少对生产机的存储性能有很大的影响,一旦上云,必将加重客户的计算成本及存储成本。即使是混合的架构部署,在网络的带宽,实施的复杂性层面也很难与云端实施相比,很难满足传统企业客户的更低的RPO(Recovery Point Objective)及RTO(Recovery Time Objective)的诉求。

从美国 FDA 新药审批制度看分级发布最佳实践

美国FDA新药审批流程被公认为世界上最完备,最科学的程序,本文将从这个审批流程出发,类比互联网公司的分级发布策略,希望能够更好的帮助大家理解。新药临床试验的”黄金标准“美国FDA新药审批流程被公认为世界上最完备,最科学的程序。目前的标准是从1962年开始实施,被称为是新药临床试验的”黄金标准“。其新药审批流程整体如下图所示,在此,我们重点介绍临床试验阶段的试验规模和试验方法临床一期实验目标是安全性,允许小范围的人群试验,通常招募20-100个健康的志愿者,付钱给他们,让他们服用该药物,严密监测可能的毒副作用,耗时1年左右。如果毒副作用在可以接受的范围内,就可以申请二期实验。

听说 iPhone 11 有最好的机器学习平台?

Apple 今天在加利福尼亚州库比蒂诺首次展示了它对未来的展望。Apple 发布了三款新的智能手机:iPhone 11、iPhone 11 Pro 和 iPhone Pro Max。正如预期的那样,Apple 更加重视如何为自己打造机器学习,同时调整硬件,以期在移动设备上提供世界上最好的机器学习平台。从高质量照片的图像处理到为了更好的性能而引入芯片,对机器学习社区而言,像这一最新事件这样的消息很少,但相当重要。发言人甚至宣布,Apple 拥有所有智能手机中最好的机器学习平台。

© 云聚网互联网资讯 我要投稿 云聚网博客 7秒MCN大数据平台 悠闲吧