Java8实战-总结27

2023-09-13 22:46:33

用流收集数据

分区

分区是分组的特殊情况:由一个谓词(返回一个布尔值的函数)作为分类函数,它称分区函数。分区函数返回一个布尔值,这意味着得到的分组Map的键类型是Boolean,于是它最多可以分为两组——true是一组,false是一组。例如,如果把菜单按照素食和非素食分开:

//分区函数
Map<Boolean, List<Dish>> partitionedMenu = menu.stream().collect(partitioningBy(Dish::isVegetarian));

这会返回下面的Map:

{false=[pork, beef,chicken, prawns, salmon], true=[french fries, rice, season fruit, pizza])

那么通过Map中键为true的值,就可以找出所有的素食菜肴了:

List<Dish> vegetarianDishes = partitionedMenu.get(true);

请注意,用同样的分区谓词,对菜单List创建的流作筛选,然后把结果收集到另外一个List中也可以获得相同的结果:

List<Dish> vegetarianDishes = menu.stream().filter(Dish::isVegetarian).collect(toList ();

分区的优势

分区的好处在于保留了分区函数返回truefalse的两套流元素列表。在上一个例子中,要得到非素食DishList,可以使用两个筛选操作来访问partitionedMenu这个Mapfalse键的值:一个利用谓词,一个利用该谓词的非。而且就像在分组中看到的,partitioningBy工厂方法有一个重载版本,可以像下面这样传递第二个收集器:

Map<Boolean, Map<Dish.Type,List<Dish>>> vegetarianDishesByType = menu.stream()
		.collect(//一分区函数
			partitioningBy(Dish::isVegetarian, 
			groupingBy(Dish::getType)));//第二个收集器

这将产生一个二级Map:

{false = {FISH = [prawns, salmon], MEAT = [pork, beef, chicken]}, 
true = {OTHER = [french fries, rice, season fruit, pizza]}}

这里,对于分区产生的素食和非素食子流,分别按类型对菜肴分组,得到了一个二级Map。再举一个例子,可以重用前面的代码来找到素食和非素食中热量最高的菜:

Map<Boolean, Dish> mostCaloricPartitionedByVegetarian = 
menu.stream().collect(
	partitioningBy(Dish::isVegetarian,
		collectingAndThen(
				maxBy(comparingInt(Dish::getCalories)),
				Optional::get)));

这将产生以下结果:

{false=pork, true=pizza}

可以把分区看作分组一种特殊情况。groupingBypartitioningBy收集器之间的相似之处并不止于此.

测验:使用partitioningBy
我们已经看到,和groupingBy收集器类似,partitioningBy收集器也可以结合其他收集器使用。尤其是它可以与第二个partitioningBy收集器一起使用来实现多级分区。
以下多级分区的结果会是什么呢?

(1)menu.stream().collect(partitioningBy(Dish::isVegetarian,
partitioningBy (d -> d.getCalories()> 500>));

(2)menu.stream().collect (partitioningBy(Dish::isVegetarian,partitioningBy (Dish::getType)));

(3)menu.stream().collect (partitioningBy(Dish::isvegetarian,counting()));

答案如下。
(1)这是一个有效的多级分区,产生以下二级Map:
{false={false=[chicken,prawns, salmon], true=[pork, beef]},
true={false=[rice, season fruit], true=[french fries, pizza]}}
(2)这无法编译,因为partitioningBy需要一个谓词,也就是返回一个布尔值的函数。方法引用Dish::getType不能用作谓词。
(3)它会计算每个分区中项目的数目,得到以下Map:
{false=5,true=4}

将数字按质数和非质数分区

假设你要写一个方法,它接受参数int n,并将前n个自然数分为质数和非质数。但首先,找出能够测试某一个待测数字是否是质数的谓词会很有帮助:

public boolean isPrime(int candidate) {
	return IntStream.range(2, candidate)//产生一个自然数范围,从2开始,直至但不包括待测数
		.noneMatch(i -> candidate % i == 0);//如果待测数字不能被流中任何数字整除则返回true

一个简单的优化是仅测试小于等于待测数平方根的因子:

public boolean isPrime(int candidate) {
	int candidateRoot =(int)Math.sqrt((double)candidate);
	return IntStream.rangeclosed(2, candidateRoot)
		.noneMatch(i -> candidate % i == 0);

现在最主要的一部分工作已经做好了。为了把前n个数字分为质数和非质数,只要创建一个包含这n个数的流,用刚刚写的isPrime方法作为谓词,再给partitioningBy收集器归约就好了:

public Map<Boolean, List<Integer>> partitionPrimes(int n) {
	return IntStream.rangeclosed(2, n).boxed()
		.collect(
			partitioningBy(candidate -> isPrime(candidate)));

现在已经讨论过了Collectors类的静态工厂方法能够创建的所有收集器,并介绍了使用它们的实际例子。下表将它们汇总到一起,给出了它们应用到stream<T>上返回的类型,以及它们用于一个叫作menuStreamStream<Dish>上的实际例子。
在这里插入图片描述
在这里插入图片描述

更多推荐

ArcGIS Pro和ArcGIS有什么区别和联系,优势有哪些?

ArcGISPro是一种新的、以地图为中心的桌面应用程序,在原有的arcgis平台上继承了强大的数据管理、空间分析、可视化和制图功能;ArcGISPro具有更灵活、更优秀的3D模型呈现和编辑功能,但对计算机要求很高;ArcGISPro是一个综合的桌面应用程序,包括许多不同的应用程序和工具;ArcGISPro更偏向现代化

SQL 语法速成手册

SQL语法速成手册一、基本概念数据库术语数据库(database)-保存有组织的数据的容器(通常是一个文件或一组文件)。数据表(table)-某种特定类型数据的结构化清单。模式(schema)-关于数据库和表的布局及特性的信息。模式定义了数据在表中如何存储,包含存储什么样的数据,数据如何分解,各部分信息如何命名等信息。

SCConv:用于特征冗余的空间和通道重构卷积

文章目录摘要1、简介2、方法2.1、SRU用于空间冗余2.2.CRU用于通道冗余2.3、复杂性分析3、实验3.1、实验设置3.3、基于CIFAR的图像分类3.4、基于ImageNet的图像分类3.5、物体检测4、结论摘要代码链接:https://github.com/cheng-haha/ScConv论文链接:http

关于阅读《重构的时机和方法》这本书所带来的启发

前言近期,我阅读了由克里斯蒂安·克劳森(ChristianClausen)写的、由郭涛翻译的《重构的时机和方法》这本书,读完这本书的内容你会发现《重构的时机和方法》是一本经典的软件开发书籍,它能够帮助软件开发人员提高代码质量和工作效率,作为程序员的我觉得这本书对我很有帮助,有了很多收获和感悟,接下来本文就来简单分享一下

Attention is all you need 论文笔记

该论文引入Transformer,主要核心是自注意力机制,自注意力(Self-Attention)机制是一种可以考虑输入序列中所有位置信息的机制。RNN介绍引入RNN为了更好的处理序列信息,比如我吃苹果,前后的输入之间是有联系的。如图:引入Transformer的原因解决长距离依赖的问题:传统的RNN存在梯度消失和梯度

Java8 Stream 数据流,大数据量下的性能效率

Stream是JavaSE8类库中新增的关键抽象,它被定义于java.util.stream(这个包里有若干流类型:Stream<T>代表对象引用流,此外还有一系列特化流,如IntStream,LongStream,DoubleStream等),Java8引入的的Stream主要用于取代部分Collection的操作,

MapReduce & YARN 的部署

1、部署说明HadoopHDFS分布式文件系统,我们会启动:NameNode进程作为管理节点DataNode进程作为工作节点SecondaryNamenode作为辅助同理,HadoopYARN分布式资源调度,会启动:ResourceManager进程作为管理节点NodeManager进程作为工作节点ProxyServe

Python 数据分析学习路线

Python数据分析学习路线第一阶段:Python语言基础第二阶段:数据采集和持久化第三阶段:数据分析第四阶段:数据挖掘与机器学习书籍介绍参与方式第一阶段:Python语言基础在学习数据分析之前,首先需要掌握Python语言的基础知识,包括语法、常用数据结构、函数以及面向对象编程等。同时,还需要熟悉Python的标准库

MySQL索引,事务及存储引擎

目录MySQL索引创建索引的依据:索引的类型普通索引唯一索引主键索引组合索引全文索引查看索引删除索引事务事务的ACID特性原子性一致性隔离性持久性隔离级别设置隔离级别事务管理操作自动提交事务存储引擎MyISAMInnoDB的区别MyISAM表支持3种不同的存储格式静态(固定长度)表动态表压缩表如何避免死锁MySQL索引

Windows 10怎么清理磁盘空间?

现在,电脑是我们日常生活中很普遍的的一个工具,但在平常使用电脑时,我们会经常遇到磁盘空间已满的问题。而很多计算机新手都不知道电脑怎么清理磁盘空间,本将已Win10系统为例,教您如何清理电脑磁盘空间。方法1.清理储存对于磁盘已满的问题,我们经常遇到的就是C盘已满。C盘也就系统盘,它存放着大量的系统文件,当您安装软件时若是

密码学概论

1.密码学的三大历史阶段:第一阶段古典密码学依赖设备,主要特点数据安全基于算法的保密,算法不公开,只要破译算法密文就会被破解,在1883年第一次提出加密算法应该基于算法公开不影响密文和秘钥的安全;衡量加密算法的安全是所需要话费的时间,一般电脑需要300年才能破译认为强度是安全的第二阶段计算机的出现进入电子密码学阶段,加

热文推荐