• 民主楼
    数据科学周刊-20170713

    数据科学周刊-20170713

    【技术框架】 1. PacificA:微软设计的分布式存储框架 摘要:随着信息量的急剧增长,大规模的分布式存储系统变得越来越重要。这些系统往……
  • 民主楼
    数据科学周刊-20170706

    数据科学周刊-20170706

    技术前沿 logkit:七牛 Pandora 开发的通用日志收集工具(Golang) 可以将不同数据源的数据方便的发送到 Pandora 进行数据分析 基于Elast……
  • 民主楼
    亚马逊推荐二十年

    亚马逊推荐二十年

    原文链接:https://www.computer.org/csdl/mags/ic/2017/03/mic2017030012.html 近期,IEEE Internet Computing上发表了一篇名为《亚马逊……
  • 民主楼
    深度解密个性化资讯推荐技术

    深度解密个性化资讯推荐技术

    资讯产品近几年持续火爆,赚足了人们的眼球。以今日头条披露的数据为例:日活跃用户超过一亿,单用户日均使用时长超过 76分钟,资讯类产……
  • 民主楼
    机器学习教程/资料下载

    机器学习教程/资料下载

    一.机器学习资料 1.网友JerryLead总结的Andrew Ng机器学习课程笔记。 斯坦福大学机器学习课程个人学习笔记(上) 斯坦福大学机器学习课……
  • 民主楼
    Elasticsearch 架构以及源码概览

    Elasticsearch 架构以及源码概览

    Elasticsearch 是最近两年异军突起的一个兼有搜索引擎和NoSQL数据库功能的开源系统,基于Java/Lucene构建。最近研究了一下,感觉 Elastic……
  • 酷炫吊炸天的四旋翼直升机

    酷炫吊炸天的四旋翼直升机

  • 12分钟看完科幻神作《三体》

    12分钟看完科幻神作《三体》

  • 开源数据库的现状:方案、设计思想及适用场景

    开源RDBMS与互联网的崛起很长时间以来,关系型数据库一直是大公司的专利,市场被 Oracle / DB2 等企业数据库牢牢把持。但是随着互联网的崛起、开源社区的发展,上世纪九十年代 MySQL 1.0 的发布,标志着关系型数据库的领域社区终于有可选择的方案。 MySQL 第一个介绍的单机 RDBMS 就是 MySQL。相信大多数朋友都已经对 MySQL 非常熟悉,基本上 MySQL 的成长史就是互联网的成长史。我接触的第一个 MySQL 版本是 MySQL 4.0,到后来的 MySQL 5.5 更是经典——基本所有的互联网公司都在使用。MySQL 也普及了「可插拔」引擎这一概念,针……
  • 消息队列设计精要

    消息队列已经逐渐成为企业IT系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能,成为异步RPC的主要手段之一。 当今市面上有很多主流的消息中间件,如老牌的ActiveMQ、RabbitMQ,炙手可热的Kafka,阿里巴巴自主开发的Notify、MetaQ、RocketMQ等。 本文不会一一介绍这些消息队列的所有特性,而是探讨一下自主开发设计一个消息队列时,你需要思考和设计的重要方面。过程中我们会参考这些成熟消息队列的很多重要思想。 本文首先会阐述什么时候你需要一个消息队列,然后以Push模型为主,从零开始分析……
  • 民主楼
    大数据领域常用的技术、框架

    大数据领域常用的技术、框架

    本文由CSDN翻译。通过阅读本文,可以对当前大数据领域有一个很好的认识,如果需要深入了解某项技术,可以阅读文章中所给的文章或论文的……
  • 民主楼
    设计高并发下的读服务

    设计高并发下的读服务

    本文作者是一个一线的电商老兵,任职于京东商城。在本文中,他将会分享他在构建以读为主的系统时总结的经验和教训,内容包括使用HTTP协议……
  • 推荐系统开发中十大关键要素

    亚马逊的CEO Jeff Bezos曾经说过,他的梦想是“如果我有100万个用户,我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想,即通过数据挖掘技 术,为每一个用户实现个性化的推荐结果,让每个用户更便捷的获取信息。为了实现这个梦想,过去十余年间,无数顶尖技术专家和工程师投身于推荐算法和技术的 研究与应用中,很多优秀的方法被提出,很多技术难题被攻克。在今天的互联网应用中,越来越多“聪明”的推荐系统被开发出来,并被广大用户信赖和使用。 智能推荐系统充分运用了机器学习、数据挖掘、搜索引擎、自然语言处理等……
  • 阿里巴巴 Java 开发手册

    本手册的愿景是码出高效、码出质量。代码的字里行间流淌的是软件生命中的血 液,质量的 升是尽可能少踩坑,杜绝踩重复的坑,切实 升质量意识。另外,现代 软件架构都需要协同开发完成,高效协作即降低协同成本, 升沟通效率,所谓无规 矩不成方圆,无规范不能协作。众所周知,制订交通法规表面上是要限制行车权,实 际上是保障公众的人身安全。试想如果没有限速,没有红绿灯,谁还敢上路行驶。对 软件来说,适当的规范和标准绝不是消灭代码内容的创造性、优雅性,而是限制过度 个性化,以一种普遍认可的统一方式一起做事, 升协作效率。 阿里巴巴 ……
  • 两个线程交替打印A、B各10次

    问题:如何实现两个线程交替打印A、B各10次? 这个问题挺经典,我这个解法的本质在于将问题抽象为生产者消费者模型,但是是一个特殊的生产者消费者模型,有两点要求: 1、缓冲区大小为1(用一个布尔变量表示就可以了) 2、缓冲区初始为空 再具体点可以将其想象为一个一次只能放一张纸打印的打印机,放纸的线程是A,打印的线程是B。初始状态打印机没有纸。 // 打印机类 public class Printer { private boolean hasBufferToPrint = false; // 打印缓冲区是否有内容可以打印 // 打印A:相当于生产……
  • Java 8 简明教程

    Java并没有没落,人们开始认识到这一点 欢迎阅读我编写的Java 8介绍。本教程将带领你一步步认识这门语言的所有新特性。通过简单明了的代码示例,你将会学习到如何使用默认接口方法,Lambda表达式,方法引用和可重复注解。在这篇教程的最后,你还将对最新推出的API有一定的了解,例如:流控制,函数式接口,map扩展和新的时间日期API等等。 没有大段的废话,只是一些带注释的代码片段,望君喜欢。 接口中的默认方法 Java 8 允许我们使用default关键字,为接口添加非抽象(non-abstract)的方法实现。这个特性又被称为扩展方法。下面是我们……
  • 民主楼
    Spark中Task,Partition,RDD、节点数、Executor数、core数目的关系

    Spark中Task,Partition,RDD、节点数、Executor数、core数目的关系

    作者:王燚光 链接:http://www.zhihu.com/question/33270495/answer/93424104 来源:知乎 梳理一下Spark中关于并发度涉及的几个概念Fi……
  • Java单例模式详解

    实现单例,从加载方式来看,有两种: 预加载 懒加载 先看一下实现单例最简单的方式(预加载): public class Foo { private static final Foo INSTANCE = new Foo(); private Foo() { if (INSTANCE != null) { throw new IllegalStateException("Already instantiated"); } } public static Foo getInstance() { return INSTANCE; } } 1234567891011121314 public class Foo {   &nbs……