百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

Java 22 的流收集器,自定义流处理中间操作

yuyutoo 2024-10-23 16:41 2 浏览 0 评论

Java 中的流终于可以自定义中间处理操作了。这是 Java 22 中新增的预览功能。

自从 Java 8 引入了 Stream 之后,Stream 在 Java 应用中的使用频率非常高。

Stream 处理时的 pipeline 由 3 个部分组成,分别是源、中间操作和终结操作:

  • 源是 Stream 中元素的来源,可以通过 Stream.of 方法创建,或者从集合类得到。
  • 中间操作对流中的元素进行处理,定义在 Stream 类中,包括 map、filter、flatMap、distinct 等。
  • 终结操作会最终产生一个结果或者副作用,包括 collect、reduce、count、forEach 等

在使用 Stream 时,一个很大的痛点是中间操作不能自定义,只能用 Stream 类提供的那些。标准库中的 Stream 类也不会随意更改来添加更多的中间操作。这就导致在某些情况下,Stream 的使用很别扭。

举个例子,Stream 里面有中间操作 distinct,可以去除流中的重复元素,但是只能按照对象相等性来去重。在实际开发中,一个很常见的需求是按照对象的属性来去重。比如,Stream 中包含的是表示学生的 Student 对象。我们希望根据 Student 对象的 id 属性来去重。这个是 distinct 无法实现的。

Java 22 引入了Gatherer 接口,可以提供自定义的 Stream 中间操作。

static <T, A, R> Gatherer<T, A, R> of(
            Supplier<A> initializer,
            Integrator<A, T, R> integrator,
            BinaryOperator<A> combiner,
            BiConsumer<A, Downstream<? super R>> finisher) {
        return new Gatherers.GathererImpl<>(
                Objects.requireNonNull(initializer),
                Objects.requireNonNull(integrator),
                Objects.requireNonNull(combiner),
                Objects.requireNonNull(finisher)
        );
    }

一个 Gatherer 接口由4个方法组成, 分别是 initializer, integrator,combiner 和 finisher。只有 integrator 是必须的,其他都是可选的。

  • initializer 创建一个新的可变状态,无状态的 Gatherer不需要提供。
  • integrator 提供传递给下游的元素。
  • combiner 在并行处理时使用,用来合并中间的状态,顺序处理时不需要提供。
  • finisher 对最终的结果执行额外的处理。

使用 Gatherer 的 of 方法来创建 Gatherer,并由 Stream 的 gather 方法来使用。

下面展示一下如何用 Gatherer来实现基于对象属性的 distinct 操作。这个 Gatherer 实现采用顺序处理,因此不需要用到 combiner。

  • State 表示中间状态,里面用一个 Map 来记录已经出现过的值。initializer 返回一个新的 State 对象。
  • integrator 对于每个元素,调用提供的 extrator 函数,从元素对象中提取属性值。属性值作为 Map 的 key, value 则是元素本身。
  • finisher 查看 State 中 Map 的全部值,并把这些值对象,通过 Downstream 的 push 方法添加进去,作为传递给下游的值。
/**
 * Distinct by an object's property, keep last duplicated element
 */
public class DistinctBy {

  /**
   * Create a new {@linkplain DistinctBy} gatherer
   *
   * @param extractor Extract the property from an element
   * @param <T>       Type of the element
   * @param <R>       Type of the element's property
   * @return A new {@linkplain DistinctBy} gatherer
   */
  static <T, R> Gatherer<T, ?, T> of(Function<? super T, ? extends R> extractor) {
    class State {

      final Map<R, T> seen = new HashMap<>();
    }

    return Gatherer.ofSequential(State::new, Integrator.ofGreedy(
            ((state, element, _) -> {
              state.seen.put(extractor.apply(element), element);
              return true;
            })),
        (state, downstream) -> state.seen.values().forEach(downstream::push)
    );
  }
}


下面的代码展示了如何使用这个 Gatherer。调用 Stream 的 gather 方法,并传入 Gatherer 对象,整体的代码清晰易懂。

public class CustomGatherers {

  record Student(String id, String name) {

  }

  void distinctBy() {
    var result = Stream.of(
            new Student("001", "Alex"),
            new Student("002", "Bob"),
            new Student("001", "Alex")
        ).gather(DistinctBy.of(Student::id))
        .toList();
    // [Student[id=001, name=Alex], Student[id=002, name=Bob]]
    System.out.println(result);
  }

  public static void main(String[] args) {
    new CustomGatherers().distinctBy();
  }
}

与 Gatherer 接口同时发布的还有几个内置的 Gatherer 实现,在 Gatherers 这个类里面。

这些内置的实现包括:

  • windowFixed 把元素收集到指定大小的窗口中。
  • windowSliding 把元素收集到指定大小的滑动窗口中。
  • fold 类似 reduce,产生一个值给下游。
  • scan 从一个初始值开始,后续的每个值根据当前值和流中的输入元素,计算而来。所有这些值都会被提供给下游。
  • mapConcurrent 执行并发的 map 操作,可以指定同时运行的最大任务数量

流收集器目前还是预览功能,我们大概率会在 Java的 下一个 LTS Java 25 中使用它。

相关推荐

如何在HTML中使用JavaScript:从基础到高级的全面指南!

“这里是云端源想IT,帮你...

推荐9个Github上热门的CSS开源框架

大家好,我是Echa。...

前端基础知识之“CSS是什么?”_前端css js

...

硬核!知网首篇被引过万的论文讲了啥?作者什么来头?

整理|袁小华近日,知网首篇被引量破万的中文论文及其作者备受关注。知网中心网站数据显示,截至2021年7月23日,由华南师范大学教授温忠麟等人发表在《心理学报》2004年05期上的学术论文“中介效应检验...

为什么我推荐使用JSX开发Vue3_为什么用vue不用jquery

在很长的一段时间中,Vue官方都以简单上手作为其推广的重点。这确实给Vue带来了非常大的用户量,尤其是最追求需求开发效率,往往不那么在意工程代码质量的国内中小企业中,Vue占据的份额极速增长...

【干货】一文详解html和css,前端开发需要哪些技术?
【干货】一文详解html和css,前端开发需要哪些技术?

网站开发简介...

2025-02-20 18:34 yuyutoo

分享几个css实用技巧_cssli

本篇将介绍几个css小技巧,目录如下:自定义引用标签的符号重置所有标签样式...

如何在浏览器中运行 .NET_怎么用浏览器运行代码

概述:...

前端-干货分享:更牛逼的CSS管理方法-层(CSS Layers)

使用CSS最困难的部分之一是处理CSS的权重值,它可以决定到底哪条规则会最终被应用,尤其是如果你想在Bootstrap这样的框架中覆盖其已有样式,更加显得麻烦。不过随着CSS层的引入,这一...

HTML 基础标签库_html标签基本结构
HTML 基础标签库_html标签基本结构

HTML标题HTML标题(Heading)是通过-...

2025-02-20 18:34 yuyutoo

前端css面试20道常见考题_高级前端css面试题

1.请解释一下CSS3的flexbox(弹性盒布局模型),以及适用场景?display:flex;在父元素设置,子元素受弹性盒影响,默认排成一行,如果超出一行,按比例压缩flex:1;子元素设置...

vue引入外部js文件并使用_vue3 引入外部js

要在Vue中引入外部的JavaScript文件,可以使用以下几种方法:1.使用``标签引入外部的JavaScript文件。在Vue的HTML模板中,可以直接使用``标签来引入外部的JavaScrip...

网页设计得懂css的规范_html+css网页设计

在初级的前端工作人员,刚入职的时候,可能在学习前端技术,写代码不是否那么的规范,而在工作中,命名的规范的尤为重要,它直接与你的代码质量挂钩。网上也受很多,但比较杂乱,在加上每年的命名都会发生一变化。...

Google在Chrome中引入HTML 5.1标记

虽然负责制定Web标准的WorldWideWebConsortium(W3C)尚未宣布HTML5正式推荐规格,而Google已经迁移到了HTML5.1。即将发布的Chrome38将引入H...

HTML DOM 引用( ) 对象_html中如何引用js

引用对象引用对象定义了一个同内联元素的HTML引用。标签定义短的引用。元素经常在引用的内容周围添加引号。HTML文档中的每一个标签,都会创建一个引用对象。...

取消回复欢迎 发表评论: