java random.nextInt的坑及解决

2021-09-23

目录
  • java random.nextInt的坑
    • 很简单的两句代码,需要注意两点
  • java random.nextInt()不随机性
    • 这个题在网上已经有很多人给出了答案
    • 我的算法是
    • 验证如下

java random.nextInt的坑

下面的代码

Random random = new Random();
Integer code = random.nextInt(len);

很简单的两句代码,需要注意两点

第一:nextInt的取值是[0,n) ,不包括n。如果是随机list,直接传list的size,不用担心下标越界。

api说明:

Returns a pseudorandom, uniformly distributed int value between 0 (inclusive) and the specified value (exclusive)

第二个:nextInt在数据量小的时候,重复概率比较高。比如现在有一个大小为6的list,我希望随机显示4条且不重复。正确的做法是每次得到随机数后,移除下标对于的对象。这样即使random重复了也没关系,因为下标对应数据移除后,同样的下标对应的对象是不一样的。

千万别像我之前的做法,遍历list,然后随机取到下标后,再去重。这样有时能得到4个,有时得不到。比如下标会出现 5,1,1,1,2,1.这样的话,最终list只会有三个。

之前一直没有怀疑是这段代码的问题,怀疑接口不稳定或者是数据不完整之类的。查日志还一直在看接口传递参数和返回参数,结果是因为对nextInt理解不深刻,在我印象中感觉randomInt是随机数且不重复的,不过事实证明我想多了。

java random.nextInt()不随机性

最近在研究算法,也写一些小程序,其中有一个是《算法导论》中的习题:描述RANDOM(a, b)过程的一种实现,它只调用RANDOM(0, 1),作为a和b的函数,你的程序的期望时间运行时间是多少?

这个题在网上已经有很多人给出了答案

我也自己写了一个算法,不过本文的主题不是针对这个问题,而是RANDOM(0, 1)的实现方法。我刚开始使用的是random.nextInt(0, 1)来取随机的0和1,也测试了其“随机性”,代码如下:

 //用Random.nextInt(2)获取0,1随机数
 //获取概率均为0.5,但不随机
 public int randomBase0() {
  Random r = new Random();
  return r.nextInt(2);
 }

用for循环10000万次,得到的0和1大致相当,可以得出获得0和1的概率为0.5。但之后我就遇到了麻烦,我写了一个方法去实现RANDOM(a, b),例如RANDOM(0, 3),得到的结果是:

0有8335个

1有825个

2有42个

3有798个

我的算法是

将b-a+1扩展到2的最小幂级数,如果是个数为5,则取8(2^3),如果为16,则取16(2^4),然后用分治算法获取a与b之间的数,其中需要将大于b的数去除掉,重新获取。

我原本以为我写RANDOM(a, b)的算法错了。后来又写了一个算法,是网上很多人使用的算法,是将随机产生的0和1拼成2进制数,然后转换为十进制数,在一个区间内在有效,超过这个区间则排除重取。

用这个算法得到的结果与第一种算法结果相同。我只好把第二种算法的二进制数打印出来查找原因,发现一个问题,就是0或1连续出现的概率要比0和1交叉出现的概率大,我想既然是随机产生0和1,那这两个生成的概率应该相同才对。

因此我得出结论,使用Random.nextInt(0, 1)获取随机数的概率并不随机,原因是其生成连续相同0或1的概率与生成交叉0和1的概率不等,并且前者大于后者,尽管单独获取0和1的个数比相当,换句话说,用这种方法获取0和1的事件不独立。

验证如下

 //检测Random.nextInt(2),连续获取两位0和1随机数
 public int randomBaseS() {
  String s = new String(new StringBuffer().append(getBoolean()).append(getBoolean()));
  
  if("00".equals(s)){
   return 0;
  }else if("01".equals(s)){
   return 1;
  }else if("10".equals(s)){
   return 2;
  }else{
   return 3;
  }
 }
 //获取随机数二进制字符串
 public String getBoolean(){
  return new String(new Integer(randomBase0()).toString());
 }

使用for循环10000次,得到的计数结果如下:

"00"有4145个

"01"有928个

"10"有905个

"11"有4022个

那哪种算法能满足要求呢?如下:

 //用Math.random()获取0,1随机数
 //获取概率均为0.5,且随机
 public int randomBase() {
  return Math.random()>0.5?1:0;
 }

以上面的方法为基础,用for循环获取[0, 3]之间的整数,得到的结果如下:

0有2525个

1有2551个

2有2433个

3有2491个

满足要求,哈哈!

以上为个人经验,希望能给大家一个参考,也希望大家多多支持北冥有鱼。

《java random.nextInt的坑及解决.doc》

下载本文的Word格式文档,以方便收藏与打印。