鱼鱼的Java小站

Spring源码解析(3) IoC容器配置读取和容器refresh

Spring源码解析(3) IoC容器配置读取和容器refresh在文章Spring源码解析(I) 基于SSM看Spring的使用和Spring启动监听中，讲述了web容器启动后会触发的方法实现中生成Context的部分，回顾下核心方法：我们已经分析到了0.处，他对我们生成的容器做了一个判断，对于web.xml监听初始化的Context，其生成的WebApplicationContext都是ConfigurableWebApplicationContext的子类，所以必然会进入if分支首先通过loadParentContext先加载了父容器，默认是null 然后调用了configureAndRefreshWebApplicationContext方法进行初始化和配置项的读取
Spring源码解析(3) IoC容器配置读取和容器refresh

2020-08-09鱼鱼

算法：Trie(前缀树、字典树）

算法：Trie(前缀树、字典树）前缀树(Trie，又称字典树)是一种功能倾向性很强的数据结构，通过对词汇的前缀做数结构，很容易实现查询、前缀词推荐系统，例如，我们将如下多个单词放入树结构中： [apple,bat,bee,cat,cap,car]，最终生成的前缀树结构为通过深度递归，我们很容易用较小的时间复杂度判断出符合前缀的单词在不在假设Trie的字符集范围是固定的，并且范围不大，例如是上面的纯英文字符，假设忽略大小写总共为26个，可以选择使用桶结构进行存储，即每一个Node都是一个长度为26的bucket数组这样看来，Trie的结构并不复杂，只通过循环不断提高深度进行遍历即可假定字符集的范围是未知的，或者范围很大（比如中文汉字），就要放弃使用bucket结构，而是通过一个Map维护，这里使用树结构TreeMap，key为相应节点的字符
算法：Trie(前缀树、字典树）

2021-01-19鱼鱼

Java中的数据结构

Java中的数据结构若不提到Jdk版本，本文中的源码都是基于jdk8版本分析的注：有关同步集合（如Vector、ConcurrentHashMap、CopyOnWriteArrayList等）请移步博客数组集合类，是Collection接口的子类，有序的Collection实现，包含ArrayList、LinkedList、Vector，其中Vector是线程安全的ArrayList，LinkedList是底层基于双向链表实现的List ArrayList的默认大小为10，扩容操作：也就是1.5倍不重复集合类，不能包含重复的元素，是Collection接口的子类，包含HashSet、LinkedHashSet、TreeSet，其实都是基于Map类的实现，所以详细了解请参阅Map类
Java中的数据结构

2019-07-12鱼鱼

Java中的协程（虚拟线程）探究

Java中的协程（虚拟线程）探究在Java最新的LTS版本 21中，终于实装了协程这一特性当然，在这些诸如python、golang等轻量级语言中被称为协程的东西，在Java中有个全新的代号——虚拟线程，为了将协程与线程做区分，在Java21中，原Thread被称之为平台线程下文中，将统一使用线程/协程的方式称呼我们都知道，Java中引入了线程的概念，区别于系统中的进程作为并发执行的最小单元，在一定的条件下，使用多个线程同时运作可以有效提高程序的运转效率而线程这一能力源于系统本身而并非JVM 之所以说是在一定条件下，是因为受限于机器配置情况（CPU的运作机制、核心数），线程的同时运作并不能线性的提升运行性能，单个cpu并不能同时处理多线程任务，实际的运作方式是基于时间片分片，各个线程抢占式执行代码，这样能减少一些无效的io等待（例如网络io、磁盘io实际是会阻塞等待io结果），同时在多核心场景下也能有效利用cpu
Java中的协程（虚拟线程）探究

2024-10-28鱼鱼

JVM与GC

JVM与GCJMM，长下面这个样子：其中，堆和栈区自然不做介绍了，主要介绍：程序计数器：线程私有的，记录正在执行的字节码地址，换言之，它告诉我们某线程执行到了那里，分支、循环等也会依赖这个来执行，这一区域不会发生OOM问题栈：就是正常所指的栈，每个方法被执行的时候都会同时创建一个栈帧（Stack Frame ）用于存储局部变量表、操作栈、动态链接、方法出口等信息每一个方法被调用直至执行完成的过程，就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程，这一区域会发生StackOverflow问题堆：就是正常所指的堆，这里是GC的主要区域方法区：线程私有的，是各个线程共享的内存区域，它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据，运行时常量池也包含在里面
JVM与GC

2019-03-28鱼鱼

Redis原理-源码解析：数据结构3 hash

Redis原理-源码解析：数据结构3 hash 所有原理实现基于Redis版本6.0.9 hash在Redis中可以认为是套了一层的string，当然，对hash来说没有数字类型让我们依旧通过基本命令看看hash的基本数据结构实现在set方法中我们看到了hash的初始创建过程，一个hash最开始是zipist 想要了解ziplist可以看Redis原理-源码解析：数据结构2 list ，是为节省内存而生的链表格式所以其实在使用ziplist时其查询的时间复杂度不是遵循hash的近似O(1)，而是O(n)，但是在数据量不大时，这种性能的损失微乎其微，并且能预见到大多数使用hash的场景都不会存储过多的字段所以优先使用了更节省内存空间的ziplist
Redis原理-源码解析：数据结构3 hash

2020-11-29鱼鱼

Spring MVC源码和设计思想2 HandlerMapping

Spring MVC源码和设计思想2 HandlerMapping系列传送门Spring MVC源码和设计思想1 DispatcherServlet-鱼鱼的博客此篇篇幅很长，且慢慢道来在之前一篇中，DispatchServlet的doDispatch()方法中有这么几行：其中getHandler方法： handlerMappings是一个初始化过的List，通过它获取HandlerExecutionChain HandlerExecutionChain存储了一个Object（其实就是HandleAdapter）和一个拦截器(HandlerInterceptor)数组，在doDispatch方法中执行了applyPreHandle和applyPostHandle方法，方法就是分别迭代调用了拦截器数组的postHandle和preHandle，同样地，发生异常时的triggerAfterCompletion也映射到了afterCompletion方法
Spring MVC源码和设计思想2 HandlerMapping

2019-06-12鱼鱼

Elasticsearch 入门

Elasticsearch 入门(注：本篇文章基于Elasticsearch7.7.0版本，由于版本的差异性造成的内容不一致我会尽量在文中标出，但是) Elasticsearch是基于Lucene扩展的全文搜索引擎，当我们有对大数据量的处理和搜索时，全文搜索引擎是最佳的选择，同时他提供了高扩展性、高可用性、RestFul风格的API和友好的分布式部署配置，在此我们不予详述我们日常使用的数据库索引是数据库一种编排数据（逻辑上）从而加快查询的手段，我们暂且将这种索引方式称为正排索引，他通过对待搜索字符寻址从而找到对应的数据但是这种索引方式对于模糊匹配会出现"断档"现象（模糊符号后的片段无法走索引查找），并且对于海量数据无论在存储上还是在查找上都略显吃力，于是在Elasticsearch中引入了倒排索引来加快查询速度
Elasticsearch 入门

2020-03-06鱼鱼

盘点redis中特殊的数据类型 HyperLogLog Bitmap

盘点redis中特殊的数据类型 HyperLogLog Bitmap 基数计数(cardinality counting)通常用来统计一个集合中不重复的元素个数，例如统计某个网站的UV，或者用户搜索网站的关键词数量数据分析、网络监控及数据库优化等领域都会涉及到基数计数的需求要实现基数计数，最简单的做法是记录集合中所有不重复的元素集合S_uSu，当新来一个元素x_ixi，若S_uSu中不包含元素x_ixi，则将x_ixi加入S_uSu，否则不加入，计数值就是S_uSu的元素数量这种做法存在两个问题：当统计的数据量变大时，相应的存储内存也会线性增长当集合S_uSu变大，判断其是否包含新加入元素x_ixi的成本变大大数据量背景下，要实现基数计数，首先需要确定存储统计数据的方案，以及如何根据存储的数据计算基数值；另外还有一些场景下需要融合多个独立统计的基数值，例如对一个网站分别统计了三天的UV，现在需要知道这三天的UV总量是多少，怎么融合多个统计值
盘点redis中特殊的数据类型 HyperLogLog Bitmap

2022-01-12鱼鱼

阻塞队列与Protobuf的Udp通信 - 基于Cat的代理(Agent)项目拆解

阻塞队列与Protobuf的Udp通信 - 基于Cat的代理(Agent)项目拆解CAT是美团点评的一个基于Java开发的异常和性能监控项目，github地址：https://github.com/dianping/cat 本篇文章不是对CAT本身的源码拆解，而是基于本人依赖CAT client开发的代理项目进行拆解，但是并不会纰漏任何技术细节 CAT当前已有很多不同语言的Client，当然暂且是不 CAT本身是通过CAT client收集数据并上报至CAT server，server会进行并，共有六种常见数据格式：Transaction、Event、Problem、Metric、HeartBeat、调用链标记，其实如果不考虑复杂的处理（譬如Metric是可以基于指标生成折线图，Problem可以根据具体的异常类型追溯到相应的会话Track）除去Transaction剩余的数据格式都可以理解为特殊的Event
阻塞队列与Protobuf的Udp通信 - 基于Cat的代理(Agent)项目拆解

2020-07-19鱼鱼

mysql orderby排序

mysql orderby排序where 字段和orderby字段组成一个联合索引，这个样一个普通业务的order只需要通过这个索引就能确定排序顺序，不需要额外的临时表来计算字段的排序可以通过配置max_length_for_sort_data改变mysql判断采取方式全字段排序将命中的行的所有要查询的结果集都放到排序的临时表内，排序后将数据结果集返回 rowid 排序将命中的行的排序字段和主键id放到临时表内排序，再根据排序后的主键id进行一次回表查询虽然有联合索引，但是当where的条件不止一个时候，order by就会失效，可以采取多次查询结果，然后在服务中排序的方式来解决问题
mysql orderby排序

2020-05-17yangwcn

ELK全家桶基本使用（I）文件收集Filebeat

ELK全家桶基本使用（I）文件收集FilebeatFilebeat是Elastic中的轻量文件收集系统，相比于功能更强悍的Logstash，当我们需求很单一，读取文件内容且对文件内容没有过多复杂处理时，最好使用FileBeat取代Logstash，以免造成不必要的内存开销文档链接 Filebeat负责收集文件并发送给下游服务核心行为包含输入、处理过滤和输出当然也有集成好配置的模块，通过模块与Es和Kibana链接可以直接在Kibana上看到组件的可视化同时不难看出Filebeat其实对数据库的支持不是很健壮截止7.6版本，开源的Filebeat可支持以下几种消息输入类型： log 用得最多的输入类型； stdin 标准的输入，从process或是piepline读取（可理解为脚本运行通道直接输入），一旦配置了这种input方式，其他 input将不再生效文档地址；

2020-03-16鱼鱼