1

一文告诉你哪些map element类型支持就地更新

 1 year ago
source link: https://tonybai.com/2023/04/02/map-element-types-support-in-place-update/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
map-element-types-support-in-place-update-1.png

本文永久链接 – https://tonybai.com/2023/04/02/map-element-types-support-in-place-update

年初,我代表团队和人民邮电出版社签订了翻译《Go Fundamentals》一书的合同,本月底便是四分之一进度的交稿时间点,近期闲时我们都在忙着做交叉review。

上周末我review小伙伴翻译的有关map类型的章节时,看到了书中对map element就地更新的讲解。Mark BatesCory LaNou的这本书属于入门级Go语言书,只是举例说明了一些支持就地更新的map element类型以及不能就地更新的典型类型,但对不能更新的原因并未做深入说明。我觉得这个知识点不错,借这篇文章系统梳理一下。

一. 什么是map element的就地更新(in-place update)

我们知道Go中的map类型是一种无序的键值对集合,它的内部实现是基于哈希表的,支持高效地进行插入、查找和删除操作。map的key必须是可以进行相等比较的类型,比如整数、字符串、指针等,而element(也称为value)则可以是任意类型。并且,map是引用类型,它的零值为nil,使用前需要先使用内置函数make或map类型字面值进行空间分配。此外,在使用map时还需要注意并发安全问题,可以使用sync包提供的同步原语中来实现map的并发安全。

更多关于map的入门介绍与原理说明,可以阅读我的极客时间专栏《Go语言第一课》的第16讲

下面我们就来声明一个简单的map类型变量:

m := map[string]int

m是一个键为string类型、element为int类型的map。我们可以通过下面代码向map中插入一个键值对:

m["boy"] = 0

我们可以将其想象为一个统计班里男孩子数量的计数器:每数到一个男孩,我们就可以将其加1:

n := m["boy"]
n++
m["boy"] = n

你可以看到上述代码更新了键”boy”对应的element值(+1)。不过这种方法比较繁琐,要更新键”boy”对应的element值,我们还有下面这个更为简洁的方法:

m["boy"]++

我们看到和前面一种方法相比,这种方法没有引入额外的变量(比如前面的变量n),而是直接在map element上进行了更新的操作,这种方法就称为map element的“就地更新”

下面还有一些支持“就地更新”的map element类型的例子,比如:string、切片等:

m["boy"] += 1

// element类型为string
m1 := map[int]string{
    1 : "hello",
    2 : "bye",
} // map[1:hello 2:bye]

m1[1] += ", world" // map[1:hello, world 2:bye]

// element类型为切片
m2 := map[string][]int{
    "k1": {1, 2},
    "k2": {3, 4},
} // map[k1:[1 2] k2:[3 4]]
m2["k1"][0] = 11 // map[k1:[11 2] k2:[3 4]]

不过并非所有类型都支持“就地更新”,比如下面的数组与结构体作为map element类型时就会导致编译错误:

m3 := map[int][10]int{
    1 : {1,2,3,4,5,6,7,8,9,10},
}
m3[1][0] = 11 // 编译错误:cannot assign to m3[1][0] (value of type int)

type P struct {
    a int
    b float64
}

m4 := map[int]P {
    1 : {1, 3.14},
    2 : {2, 6.28},
}
m4[1].a = 11 // 编译错误:cannot assign to struct field m4[1].a in map

注:Go issue 3117一直跟踪着上述结构体类型作为map element时不能就地更新的问题。该issue并没有close,说明也许未来Go针对这样的行为的处理可能会发生变化。

那么为什么会这样呢?为什么同样作为map element,有的类型可以就地更新,有的类型就不支持呢?我们继续向下看。

二. element类型支持就地更新的本质

实际上,这种支持element类型就地更新其实是一种“语法糖”,比如我们以上面的m变量为例:

m := map[string]int{
    "boy" : 0,
}

当我们执行下面的就地更新语句时:

m["boy"]++

上面的语句就等价于:

a := m["boy"]
a++
m["boy"] = a

我们再来看下面element为字符串类型的例子:

m1 := map[int]string{
    1 : "hello",
    2 : "bye",
} 

m[1] += "world"

上述字符串连接语句等价于:

s := m[1]
s += "world"
m[1] = s

到这里小伙伴们可能会问:为什么Go不针对类型为struct和array的element提供这种语法糖呢?我们假设struct的字段更新也支持就地更新,那么会发生什么呢?

type P struct {
    a int
    b float64
}

m4 := map[int]P {
    1 : {1, 3.14},
    2 : {2, 6.28},
}
m4[1].a = 11

上面的m4[1].a = 11将等价于如下代码:

t := &(m4[1])
t.a = 11

我们看到与element类型为int或string不同,由于要更新struct内部的字段,我们这次必须获取element的地址。一旦可以获取地址,问题就来了!这个地址是map在runtime层维护的内存地址,一旦暴露出来至少会有如下两个问题:

  • 并发访问时会导致该element数据的竞争问题;
  • map自动扩容后,element地址会变更,通过上述代码获取的地址可能变为无效。

当然第二点更为重要,也正是因为这个原因,Go决定不支持对map的element取地址

到这里有些小伙伴可能会问:针对struct和array类型的element,为什么不提供下面这样的“语法糖”呢?以struct为例:

m4[1].a = 11 

<=>

t := m4[1]
t.a = 11
m4[1] = t

即将struct和array作为一个整体,从map中获取副本,然后在临时变量中更新后,再重新覆盖map中的element。

go为什么不提供这种“语法糖”呢?我猜是因为这么做的性能开销较大!struct可以聚合很多字段,array的size也可能很可观,这样的两次copy的开销可能是Go开发者比较顾忌的。

那么目前的替代方案是什么呢? 其实很简单,那就是element类型使用指针类型,比如下面element类型为结构体指针类型的代码:

type P struct {
    a int
    b float64
}

m := map[int]*P{
    1: {1, 3.14},
    2: {2, 6.28},
}
fmt.Println(m[1]) // &{1 3.14}

m[1].a = 11

fmt.Println(m[1]) // &{11 3.14}

再比如element类型为数组指针类型的代码:

m1 := map[int]*[10]int{
    1: {1, 2, 3},
}
fmt.Println(m1[1]) // &[1 2 3 0 0 0 0 0 0 0]
m1[1][0] = 11
fmt.Println(m1[1]) // &[11 2 3 0 0 0 0 0 0 0]

对map element“就地更新”的限制也会影响到是否能调用element类型的相关方法,我们再来看下面例子:

type P struct {
    a int
    b float64
}

func (P) normalFunc() {
}

func (p *P) updateInPlace(a int) {
    p.a = a
}

func main() {

    m1 := map[int]P{
        1: {1, 3.14},
        2: {2, 6.28},
    }
    m1[1].normalFunc()
    m1[1].updateInPlace(11) // 编译错误:cannot call pointer method updateInPlace on P

    m2 := map[int]*P{
        1: {1, 3.14},
        2: {2, 6.28},
    }
    fmt.Println(m2[1].a) // 1
    m2[1].normalFunc()
    m2[1].updateInPlace(11)
    fmt.Println(m2[1].a) // 11
}

我们看到当element类型为P时,我们无法通过语法糖来调用会对结构体字段进行修改的updateInPlace方法,但可以调用normalFunc。而当element类型为P指针类型时,则无此限制。

那么,我们究竟如何判断哪些类型支持就地更新,哪些不支持呢?我们接下来就来说说。

三. element类型是否支持就地更新的判断方法

我们先来梳理一下Go的主要类型是否支持就地更新。

  • 不涉及就地更新的类型

当element类型为布尔类型、函数类型时,我没找出针对这些map element就地更新的写法。

注:函数在Go中是一等公民。

  • Go原生的基本类型,比如整型、浮点型、complex类型、string类型等

当这些类型作为map element类型时,虽然它们保存在map数据结构管理的内存中,但根据前面的讲解,我们知道Go针对这些element type提供的“就地更新”语法实际上是一个语法糖,Go实际做的依然是整体替换

// 整型
m1 := map[int]int{
    1: 1,
}
m1[1]++
fmt.Println(m1[1]) // 2

// 浮点型
m3 := map[int]float64{
    1: 3.14,
}
m3[1]++
fmt.Println(m3[1]) // 4.140000000000001

// complex类型
m4 := map[int]complex128{
    1: complex(2, 3), // 2+3i
}
m4[1]++
fmt.Println(m4[1]) // 3+3i

// string类型
m5 := map[int]string{
    1: "hello",
}
m5[1] += " world"
fmt.Println(m5[1]) // hello world
  • 对于指针、map、channel等类型

通过前面的讲解,我们知道使用指针作为map element类型是支持就地更新的,这里就不重复举例了。

map类型自身在Go运行时表示中也是一个指针,它也是支持就地更新的:

m := map[int]map[int]string{
    1: {1: "hello"},
}
m[1][1] += " world"
fmt.Println(m[1][1]) // hello world

关于channel类型,如果将向channel写入数据当作“就地更新”的话,那么channel也勉强算是支持:

// channel
m1 := map[int]chan int{
    1: make(chan int),
}
go func() {
    m1[1] <- 11
}()

fmt.Println(<-m1[1]) // 11
  • 对于切片、接口类型

通过前面的讲解,我们知道使用切片作为map element类型是支持就地更新的,这里就不重复举例了。

而对于接口类型,我理解的就地更新场景有两种,一种是通过接口值调用动态类型的方法,一种则是通过type assert来修改某些值。下面这两个场景的示例代码:

type MyInterface interface {
    normalFunc()
    updateInPlace(a int)
}

type P struct {
    a int
    b float64
}

func (P) normalFunc() {
}

func (p *P) updateInPlace(a int) {
    p.a = a
}

func main() {
    // interface
    m1 := map[int]MyInterface{
        1: &P{1, 3.14},
    }

    m1[1].updateInPlace(11) // 场景1:调用就地更新的方法

    p := m1[1].(*P)
    fmt.Println(p.a) // 11

    (m1[1].(*P)).a = 21     // 场景2:通过type assert设置值
    p = m1[1].(*P)
    fmt.Println(p.a) // 21
}
  • 对于数组、struct类型

通过前面的讲解,我们知道使用数组和struct类型作为map element类型是不支持就地更新的,这里就不重复举例了。

通过对上面诸多类型的示例与理解,不知道你是否发现了支持“就地更新”的map element类型的一些共同特点。

除了语法糖之外(比如int、string、float64等),其余支持“就地更新”的map element类型(比如指针、切片、接口等)有一个共同的特点,那就是我们要就地更新的值对应的内存并不在map的管辖范围内

以切片为例,如下图:

map-element-types-support-in-place-update-2.png

我们知道切片在运行时的表示为包含三个字段的结构体,因此map[int][]int实际上是一个map[int]SliceHeader。而这个map的element的就地修改:m[1][0] = 11实际上并未修改SliceHeader中的任何值,修改的是SliceHeader中data指针指向的切片底层数组的元素。

更多关于切片的基础知识与运行时表示原理,可以阅读极客专栏《Go语言第一课》的第15讲

这就是为什么切片类型的map element支持就地修改的原因。由此来看指针、接口等类型,都是同样的道理,即element自身值并未有被修改,而是element指向的map结构之外的内存区域被修改了

一句话:只要修改的位置不在map管辖的内存中,那这个map element类型就支持就地更新


“Gopher部落”知识星球旨在打造一个精品Go学习和进阶社群!高品质首发Go技术文章,“三天”首发阅读权,每年两期Go语言发展现状分析,每天提前1小时阅读到新鲜的Gopher日报,网课、技术专栏、图书内容前瞻,六小时内必答保证等满足你关于Go语言生态的所有需求!2023年,Gopher部落将进一步聚焦于如何编写雅、地道、可读、可测试的Go代码,关注代码质量并深入理解Go核心技术,并继续加强与星友的互动。欢迎大家加入!

img{512x368}
img{512x368}
img{512x368}
img{512x368}

著名云主机服务厂商DigitalOcean发布最新的主机计划,入门级Droplet配置升级为:1 core CPU、1G内存、25G高速SSD,价格5$/月。有使用DigitalOcean需求的朋友,可以打开这个链接地址:https://m.do.co/c/bff6eed92687 开启你的DO主机之路。

Gopher Daily(Gopher每日新闻)归档仓库 – https://github.com/bigwhite/gopherdaily

我的联系方式:

  • 微博(暂不可用):https://weibo.com/bigwhite20xx
  • 微博2:https://weibo.com/u/6484441286
  • 博客:tonybai.com
  • github: https://github.com/bigwhite
iamtonybai-wechat-qr.png

商务合作方式:撰稿、出书、培训、在线课程、合伙创业、咨询、广告合作。

© 2023, bigwhite. 版权所有.

Related posts:


Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK