Unity3D热门教程

游戏开发工具

vi/vim使用教程
Vim是UNIX文本编辑器Vi的加强版本,加入了更多特性来帮助编辑源代码。Vim的部分增强功能包括文件比较（vimdiff），语法高亮，全面的帮助系统，本地脚本（Vimscript），和便于选择的可视化模式。
Atom跨平台文本编辑器
Atom是Github专门为程序员推出的一个跨平台文本编辑器。具有简洁和直观的图形用户界面，并有很多有趣的特点：支持CSS，HTML，JavaScript等网页编程语言。它支持宏，自动完成分屏功能，集成了文件管理器。
SublimeText使用手册
SublimeText是一个文本编辑器（收费软件，可以无限期试用），同时也是一个先进的代码编辑器。SublimeText是由程序员JonSkinner于2008年1月份所开发出来，它最初被设计为一个具有丰富扩展功能的Vim。
VSCode代码编辑器
VSCode，全称是VisualStudioCode，但因为全称太长，微软旗下另一款产品visualstudio又经常被简称为VS，所以这款与vs有一定渊源的代码编辑器就被简称为VSCode。
Gradle构建工具
Gradle是一个基于JVM的富有突破性构建工具，其正迅速成为许多开源项目和前沿企业构建系统的选择，同时也在挑战遗留的自动化构建项目。本教程主要讲解了如何使用Gradle构建系统和构建系统过程中涉及的插件。
Git 教程
Git是一个开源的分布式版本控制系统，用于敏捷高效地处理任何或小或大的项目。
SVN 教程
ApacheSubversion通常被缩写成SVN，是一个开放源代码的版本控制系统，Subversion在2000年由CollabNetInc开发，现在发展成为Apache软件基金会的一个项目，同样是一个丰富的开发者和用户社区的一
Android 教程
AndroidSDK是开发Android必备的工具包，集软件包、软件框架、硬件平台、操作系统等建立应用软件的开发工具于一身。
iOS 开发手册
iOS的app采用Objective-C开发，近年苹果在推广Swift语言。学习iOS开发需要一台mac电脑，安装Xcode开发软件。至于苹果手机，如果有的话更好，使用模拟器也可以完成大部分的开发工作，除了推送，扫码等依赖真机的情况。
鸿蒙OS开发文档
鸿蒙OS凭借多终端开发IDE，多语言统一编译，分布式架构Kit提供屏幕布局控件以及交互的自动适配，支持控件拖拽，面向预览的可视化编程，从而使开发者可以基于同一工程高效构建多端自动运行App，实现真正的一次开发，多端部署，

HyperLogLogs基数统计

【二】Redis常用数据类型

11 篇文章56 次收藏

收藏专栏

关于HyperLogLog

HyperLogLog 主要用于Redis 的基数统计，它的数据结构专门设计用来做数据合并和计算，并能节省大量的空间。
基数计数( cardinality counting) 通常用来统计一个集合中不重复的元素个数 , 例如统计某个网站的UV、PV或者网站搜索的的关键词数量。
在各种应用领域基数统计被广泛应用，如数据分析、网络监控指标、存储性能优化等。
简单来说，基数计数就是记录集合中所有不重复的元素Su ,当新增元素Xa时,判断Su中是否包含,不包含则将其加入Su,包含则不加入,计数值就是Su 的元素数量总和。
当然这种做法也存在两个问题：
1、当统计的数据量变大时,相应的存储内存也会线性增长
2、当集合Su 变大,判断其是否包含新加入元素的成本变大

实际应用场景

很多计数类场景，比如每日注册 IP 数、每日访问 IP 数、页面实时访问数 PV、访问用户数 UV等。
因为主要的目标高效、巨量地进行计数，所以对存储的数据的内容并不关系。也就是说它只能用于统计数量，没办法知道具体的统计对象的内容。
1、统计单日一个页面的访问量(PV)，单次访问就算一次。
2、统计单日一个页面的用户访问量(UV)，即按照用户为维度计算，单个用户一天内多次访问也只算一次。
3、多个key的合并统计，某个门户网站的所有模块的PV聚合统计就是整个网站的总PV。

高效和海量特性

如果我们使用普通集合，也能够实现对巨量数据的存储和统计么，但是存储量会大很多，性能也比较差。
以百度搜索为例，如果要做百度指数的计算，针对来访IP进行统计。那么如果每天有 1000 万 IP，一个 IP 占位 15 字节，那么 1000 万个 IP 就是 143M。

10,000,000 * 15 /(1024 * 1024)  = 143.05 M

如果使用 HyperLogLog ，那么在 Redis 中每个键占用的内容都是 12K，理论上能够存储 264 个值，即18446744073709551616，这个数是巨量，Java中long类型也只能计算到 262 。

无论存储何值，它一个基于基数估算的算法HyperLogLog Counting（简称HLLC），使用少量固定的内存去存储并识别集合中的唯一元素。

HLLC采用了分桶平均的思想来消减误差，在Redis中, 有16384个桶。而HyperLogLog的标准偏差公式是1.04 / sqrt(m)，m 为桶的个数。所以

1.04 / sqrt(16384) = 1.04 / 128 = 0.008125

所以这个计数的估算，是一个带有 0.81% 标准偏差的近似值。

HyperLogLog所支持的能力

HyperLogLog数据结构的命令有三个：PFADD、PFCOUNT、PFMERGE

1、PFADD 添加计数

Redis Pfadd 命令将所有元素添加到 HyperLogLog 数据结构中。

语法如下：

redis > PFADD key element [element ...]

下面举例了网站统计模块添加IP的两种情况

/* 对访问百度网站(key=baidu:ip_address)的IP进行添加 */
redis> PFADD baidu:ip_address "192.168.0.1" "192.168.0.2" "192.168.0.3"
(integer) 1
 
/* 如果IP已经存在，则进行忽略，不对估计数量进行更新 */
redis> PFADD baidu:ip_address "192.168.0.3"  
(integer) 0  # IP已经存在

2、PFCOUNT 统计数量

Redis Pfcount 命令返回给定 HyperLogLog 的基数的估算值。

语法如下：

redis > PFCOUNT key [key ...]

下面估算了访问IP的基数的值，返回 1034546 。

redis> PFCOUNT baidu:ip_address
(integer) 1034546

3、PFMERGE 合并统计

Redis PFMERGE 命令将多个 HyperLogLog 合并为一个 HyperLogLog ，合并后的 HyperLogLog 的基数估算值是对给定 HyperLogLog 进行并集计算得出的。

所以有重复的会被统计成一条数据。

合并得出的 HyperLogLog 会被储存在 destkey 键里面，如果该键并不存在，那么命令在执行之前，会先为该键创建一个空的 HyperLogLog 。

语法如下：

redis > PFMERGE destkey sourcekey [sourcekey ...]

下面演示了合并和统计的过程：

/* 统计百度 baidu:ip_address 访问IP */
redis> PFADD baidu:ip_address "192.168.0.1" "192.168.0.2" "192.168.0.3"
(integer) 1
 
 /* 统计淘宝 taobao:ip_address 访问IP */
redis> PFADD taobao:ip_address "192.168.0.3" "192.168.0.4" "192.168.0.5"
(integer) 1
 
/* 合并且去重之后放在 total:ip_address  */
redis> PFMERGE total:ip_address baidu:ip_address taobao:ip_address
OK
 
/* 结果为5 */
redis> PFCOUNT total:ip_address
(integer) 5

总结

基数计数是用于统计一个集合中不重复的元素个数，好比平常需求场景有，统计页面的UV或者统计在线的用户数、注册IP数等。HyperLogLog 主要基于Redis能力下的基数统计。HyperLogLog的主要使用场景包括：

1、统计单日一个页面的访问量(PV)，单次访问就算一次。

2、统计单日一个页面的用户访问量(UV)，即按照用户为维度计算，单个用户一天内多次访问也只算一次。

3、多个key的合并统计，某个门户网站的所有模块的PV聚合统计就是整个网站的总PV。

游戏研发分享

游戏前沿资讯

Unity3D热门教程

Redis在游戏服务器应用

Redis故障排除

Redis高级教程

Redis的特性和原理

Redis常用数据类型

Redis简介

Unity3D热门话题

游戏开发工具

vi/vim使用教程

Atom跨平台文本编辑器

SublimeText使用手册

VSCode代码编辑器

Gradle构建工具

Git 教程

SVN 教程

Android 教程

iOS 开发手册

鸿蒙OS开发文档

HyperLogLogs基数统计

关于HyperLogLog

实际应用场景

高效和海量特性

HyperLogLog所支持的能力

总结