返回

首页

业界

电商

创业

访谈

手机

移动

报告

运营

建站

互联网+

系统

教程

易采站长站-移动端

golang中bufio.SplitFunc的深入理解

2020-01-28 13:34:31刘景俊

好了，废话少说，开始正题吧！

Scanner和SplitFunc的工作机制


package "buffio"
type SplitFunc func(data []byte, atEOF bool) (advance int, token []byte, err error)



Scanner是有缓存的，意思是Scanner底层维护了一个Slice用来保存已经从Reader中读取的数据，Scanner会调用我们设置SplitFunc，将缓冲区内容(data)和是否已经输入完了(atEOF)以参数的形式传递给SplitFunc，而SplitFunc的职责就是根据上述的两个参数返回下一次Scan需要前进几个字节(advance)，分割出来的数据(token)，以及错误(err)。
这是一个通信双向的过程，Scanner告诉我们的SplitFunc已经扫描到的数据和是否到结尾了，我们的SplitFunc则根据这些信息将分割的结果返回和下次扫描需要前进的位置返回给Scanner。用一个例子来说明：


package main
import (
 "bufio"
 "fmt"
 "strings"
)
func main() {
 input := "abcdefghijkl"
 scanner := bufio.NewScanner(strings.NewReader(input))
 split := func(data []byte, atEOF bool) (advance int, token []byte, err error) {
  fmt.Printf("%tt%dt%sn", atEOF, len(data), data)
  return 0, nil, nil
 }
 scanner.Split(split)
 buf := make([]byte, 2)
 scanner.Buffer(buf, bufio.MaxScanTokenSize)
 for scanner.Scan() {
  fmt.Printf("%sn", scanner.Text())
 }
}


输出

false 2 ab

false 4 abcd

false 8 abcdefgh

false 12 abcdefghijkl

true 12 abcdefghijkl

这里我们把缓冲区的初始大小设置为了2，不够的时候会扩展为原来的2倍，最大为bufio.MaxScanTokenSize,这样一开始扫描2个字节，我们的缓冲区就满了，reader的内容还没有读取到EOF，然后split函数执行，输出:

false 2 ab

紧接着函数返回 0, nil, nil这个返回值告诉Scanner数据不够，下次读取的位置前进0位，需要继续从reader里面读取,此时因为缓冲区满了，所以容量扩展为2 * 2 = 4，reader的内容还没有读取到EOF，输出

false 4 abcd

重复上述步骤，一直到最后全部内容读取完了，EOF此时变成了true

true 12 abcdefghijkl

看了上面的过程是不是对SplitFunc的工作原来有了一点理解了呢？再回头看一下golang的官方文档有没有觉得稍微理解了一点?下面是bufio.ScanLines的实现，读者可以自己研究一下该函数是如何工作的
标准库里的ScanLines




func ScanLines(data []byte, atEOF bool) (advance int, token []byte, err error) {
 // 表示我们已经扫描到结尾了
 if atEOF && len(data) == 0 {
  return 0, nil, nil
 }
 // 找到n的位置
 if i := bytes.IndexByte(data, 'n'); i >= 0 {
  // 把下次开始读取的位置向前移动i + 1位
  return i + 1, dropCR(data[0:i]), nil
 }
 // 这里处理的reader内容全部读取完了，但是内容不为空，所以需要把剩余的数据返回
 if atEOF {
  return len(data), dropCR(data), nil
 }
 // 表示现在不能分割，向Reader请求更多的数据
 return 0, nil, nil
}								  2/3   首页 上一页 1 2 3 下一页 尾页


		
				
    相关文章
    大家在看


    
			



手把手教你使用正则表达式验证银行帐号
2023-03-15
0万阅读





JS中正则表达式全局匹配正斜杠的方法
2023-03-02
0万阅读





python如何用正则表达式提取字符串
2023-03-02
0万阅读





如何将mov直接刻录成vcd
2023-02-23
3万阅读





火云术语怎么查找术语库
2023-02-17
5万阅读





python中如何使用正则表达式提取数据
2023-02-06
21万阅读





Regex正则表达式判断密码强度
2023-02-03
6万阅读





Regex正则表达式判断密码强度
2023-02-01
6万阅读





python中的正则表达式,贪婪匹配与非贪婪匹配方式
2023-01-31
7万阅读





winrar压缩完后实现自动关机
2023-01-19
8万阅读


			
		
	  
    
	
	


手把手教你使用正则表达式验证银行帐号
2023-03-15
0万阅读





JS中正则表达式全局匹配正斜杠的方法
2023-03-02
0万阅读





python如何用正则表达式提取字符串
2023-03-02
0万阅读





如何将mov直接刻录成vcd
2023-02-23
3万阅读





火云术语怎么查找术语库
2023-02-17
5万阅读





python中如何使用正则表达式提取数据
2023-02-06
21万阅读





Regex正则表达式判断密码强度
2023-02-03
6万阅读





Regex正则表达式判断密码强度
2023-02-01
6万阅读





python中的正则表达式,贪婪匹配与非贪婪匹配方式
2023-01-31
7万阅读





winrar压缩完后实现自动关机
2023-01-19
8万阅读


	
    

        
电脑版 - 移动首页