6

Go工程化(二) 项目目录结构

 3 years ago
source link: https://lailin.xyz/post/go-training-week4-project-layout.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client
Go工程化(二) 项目目录结构

本系列为 Go 进阶训练营 笔记,预计 2021Q1 完成更新,访问 博客: Go 进阶训练营 即可查看当前更新进度,部分文章篇幅较长,使用 PC 大屏浏览体验更佳

工程化这一节说简单看似简单,无非就是目录结构,代码分层,依赖注入等等。但是其中很多坑如果没踩过是不知道这里面的痛点的。除此之外这里面也会有很多架构的思想在里面,这也就是为什么我会把架构整洁之道的阅读笔记放在第一小节的原因。

接来下包含这一篇文章在内,我会先用几篇文章结合参考材料以及个人的理解整理一下毛老师课上讲的内容。然后恰好在这个课程前,我也在对我们之前的一些项目做重构,所以会再用一到两篇文章大概说一些我最后选择的方式,已经在实践过程中的一些取舍,就工程化这个事情来说大概原理上基本都是相通的,但是每个团队甚至每个人所面临的一些问题都各不相同,所以最后出来的东西肯定不是完全一致的。

注意,你如果是只是需要写一个脚本,或者是做一些简单的 demo 大可不必像文章接下来介绍的这样搞的这么麻烦,直接一个 main.go 简单快捷方便即可,但是如果你这是一个长期维护的项目,甚至涉及到的多个人之间的合作,那么接下来的几篇文章就不能错过了,可以仔细阅读,希望可以对你有所帮助。

Standard Go Project Layout

这一部分的内容主要来自于 github 的高星项目:golang-standards/project-layout 通过这个我们可以大概的了解到在 Go 中一些约定俗成的目录含义,虽然这些不是强制性的,但是如果有去看官方的源码或者是一些知名的项目可以发现大多都是这么命名的,所以我们最好和社区保持一致,大家保持同样的语言。

我们一般采用 /cmd/[appname]/main.go 的形式进行组织

  • 首先 cmd 目录下一般是项目的主干目录
  • 这个目录下的文件不应该有太多的代码,不应该包含业务逻辑
  • main.go 当中主要做的事情就是负责程序的生命周期,服务所需资源的依赖注入等,其中依赖注入一般而言我们会使用一个依赖注入框架,这个主要看复杂程度,后续会有一篇文章单独介绍这个

/internal

internal 目录下的包,不允许被其他项目中进行导入,这是在 Go 1.4 当中引入的 feature,会在编译时执行

  • 所以我们一般会把项目文件夹放置到 internal 当中,例如 /internal/app
  • 如果是可以被其他项目导入的包我们一般会放到 pkg 目录下
  • 如果是我们项目内部进行共享的包,而不期望外部共享,我们可以放到 /internal/pkg 当中
  • 注意 internal 目录的限制并不局限于顶级目录,在任何目录当中都是生效的

举个 🌰 下面的是我们当前的目录结构,其中的代码很简单,在 t.go 当中导出了一个变量 I 然后在 a/cmd/a/main.gob/cmd/b/main.go 当中分别导入输出这个变量的值

1
2
3
4
5
6
7
8
9
10
11
12
13
14
❯ tree
.
├── a
│ ├── cmd
│ │ └── a
│ │ └── main.go
│ └── internal
│ └── pkg
│ └── t
│ └── t.go
└── b
└── cmd
└── b
└── main.go

我们可以发现, a 目录下可以直接输出 I 的值

1
2
❯ go run ./a/cmd/a/main.go
1

但是在 b 目录下,编译器会直接报错说导入了 a 的私有包

1
2
3
❯ go run ./b/cmd/b/main.go
package command-line-arguments
b/cmd/b/main.go:3:8: use of internal package github.com/mohuishou/go-training/Week04/blog/02_project_layout/01_internal_example/a/internal/pkg/t not allowed

一般而言,我们在 pkg 目录下放置可以被外部程序安全导入的包,对于不应该被外部程序依赖的包我们应该放置到 internal 目录下, internal 目录会有编译器进行强制验证

  • pkg 目录下的包一般会按照功能进行区分,例如 /pkg/cache/pkg/conf
  • 如果你的目录结构比较简单,内容也比较少,其实也可以不使用 pkg 目录,直接把上面的这些包放在最上层即可
  • 一般而言我们应用程序 app 在最外层会包含很多文件,例如 .gitlab-ci.yml makefile .gitignore 等等,这种时候顶层目录会很多并且会有点杂乱,建议还是放到 /pkg 目录比较好

Kit Project Layout

kit 库其实也就是一些基础库

  • 每一个公司正常来说应该有且仅有一个基础库项目
  • kit 库一般会包含一些常用的公共的方法,例如缓存,配置等等,比较典型的例子就是 go-kit
  • kit 库必须具有的特点:
    • 标准库方式布局
    • 尽量减少依赖
减少依赖和持续维护是我后面补充的,这一点其实很遗憾,我们部门刚进来的时候方向是对的也建立了一套基础库,然后大家都使用这同一套库,但是很遗憾,我们这一套库一是没人维护,二是没有一套机制来进行迭代,到现在很多团队和项目已经各搞各的了。
这样其实会导致做很多重复工作以及后续的一些改动很难推进,前车之鉴,如果有类似的情况一定要在小火苗出来的时候先摁住,从大的角度来讲统一有时候比好用重要,不好用应该参与贡献而不是另起炉灶。

Service Application Project Layout

在这一小节我们会先看到毛老师在课上讲解的他们的应用程序目录的迭代变化,然后说一些我最后的采用的目录结构以及里面的取舍,关于具体怎么演进来的当中遇到了什么问题,我们会在 Go 工程化这个系列的最后一篇文章详细说明。

API 定义的目录,如果我们采用的是 grpc 那这里面一般放的就是 proto 文件,除此之外也有可能是 openapi/swagger 定义文件,以及他们生成的文件。

下面给出一个我现在使用的 api 目录的定义,其实和毛老师课上讲的类似,后面还有一篇文章会专门讲 api 的设计会讲到这里就不详细讲了

1
2
3
4
5
6
.
└── api
└── product_name // 产品名称
└── app_name // 应用名称
└── v1 // 版本号
└── v1.proto

/config(s)

为什么加个(s) 是课上讲的还有参考材料中很多都叫 configs 但是我们习惯使用 config 但是含义上都是一样的
这里面一般放置配置文件文件和默认模板

/test

额外的外部测试应用程序和测试数据。一般会放测试一些辅助方法和测试数据

微服务中的 app 服务类型分为 4 类:interface、service、job、admin。

  • interface: 对外的 BFF 服务,接受来自用户的请求,比如暴露了 HTTP/gRPC 接口。
  • service: 对内的微服务,仅接受来自内部其他服务或者网关的请求,比如暴露了 gRPC 接口只对内服务。
  • admin:区别于 service,更多是面向运营测的服务,通常数据权限更高,隔离带来更好的代码级别安全。
  • job: 流式任务处理的服务,上游一般依赖 message broker。
  • task: 定时任务,类似 cronjob,部署到 task 托管平台中。

这上面是毛老师课上讲解的类型,和我们常用的做法类似,但是有点区别,同样假设我们有一个应用叫 myapp

  • myapp-api: 这个是对外暴露的 api 的服务,可以是 http, 也可以是 grpc
  • myapp-cron: 这个是定时任务
  • myapp-job: 这个用于处理来自 message 的流式任务
  • myapp-migration: 数据库迁移任务,用于初始化数据库
  • scripts/xxx: 一次性执行的脚本,有时候会有一些脚本任务

大多大同小异,主要是 BFF 层我们一般是一个独立的应用,不会放在同一个仓库里面,

项目布局 v1

项目的依赖路径为: model -> dao -> service -> api,model struct 串联各个层,直到 api 需要做 DTO 对象转换。

  • model: 放对应“存储层”的结构体,是对存储的一一隐射。
  • dao: 数据读写层,数据库和缓存全部在这层统一处理,包括 cache miss 处理。
  • service: 组合各种数据访问来构建业务逻辑。
  • server: 依赖 proto 定义的服务作为入参,提供快捷的启动服务全局方法。
  • api: 定义了 API proto 文件,和生成的 stub 代码,它生成的 interface,其实现者在 service 中。
  • service 的方法签名因为实现了 API 的 接口定义,DTO 直接在业务逻辑层直接使用了,更有 dao 直接使用,最简化代码。
  • DO(Domain Object): 领域对象,就是从现实世界中抽象出来的有形或无形的业务实体。缺乏 DTO -> DO 的对象转换。

v1 存在的问题

  • 没有 DTO 对象,model 中的对象贯穿全局,所有层都有
    • model 层的数据不是每个接口都需要的,这个时候会有一些问题
    • 在上一篇文章中其实也反复提到了 “如果两段看似重复的代码,如果有不同的变更速率和原因,那么这两段代码就不算是真正的重复”
  • server 层的代码可以通过基础库干掉,提供统一服务暴露方式

项目布局 v2

  • app 目录下有 api、cmd、configs、internal 目录,目录里一般还会放置 README、CHANGELOG、OWNERS。
  • internal: 是为了避免有同业务下有人跨目录引用了内部的 biz、data、service 等内部 struct。
    • 如果存在一个仓库多个应用,那么可以在 internal 里面进行分层,例如 /internal/app , /internal/job
    • biz: 业务逻辑的组装层,类似 DDD 的 domain 层,data 类似 DDD 的 repo,repo 接口在这里定义,使用依赖倒置的原则。
    • data: 业务数据访问,包含 cache、db 等封装,实现了 biz 的 repo 接口。我们可能会把 data 与 dao 混淆在一起,data 偏重业务的含义,它所要做的是将领域对象重新拿出来,我们去掉了 DDD 的 infra 层。
    • service: 实现了 api 定义的服务层,类似 DDD 的 application 层,处理 DTO 到 biz 领域实体的转换(DTO -> DO),同时协同各类 biz 交互,但是不应处理复杂逻辑。
  • PO(Persistent Object): 持久化对象,它跟持久层(通常是关系型数据库)的数据结构形成一一对应的映射关系,如果持久层是关系型数据库,那么数据表中的每个字段(或若干个)就对应 PO 的一个(或若干个)属性。

示例可以参考 kratos v2 的 example

我的项目布局

1
2
3
4
5
6
7
8
9
10
11
.
├── api
├── cmd
│ └── app
├── config
├── internal
│ ├── domain
│ ├── repo
│ ├── service
│ └── usecase
└── pkg

internal: 是为了避免有同业务下有人跨目录引用了内部的对象

  • domain: 类似之前的 model 层,这里面包含了 DO 对象,usecase interface, repo interface 的定义
  • repo: 定于数据访问,包含 cache, db 的封装
  • usecase: 这里是业务逻辑的组装层,类似上面的 biz 层,但是区别是我们这里不包含 DO 对象和 repo 对象的定义
  • service: 实现 api 的服务层,主要实现 DTO 和 DO 对象的转化,参数的校验等等
    我们这里的定义和上面 v2 最大的区别是多了一个 domain 层,这里面有一个原因是我们对于单元测试的要求比较高,如果按照上面 v2 的代码进行组织,service 层直接依赖 usecase 的实现,service 的代码不太好进行单元测试。如果依赖 interface 会导致循环依赖,所以采用类似 go-clean-arch 的组织,单独抽象一层 domain 层

应该避免的坏习惯

一般而言,在 Go 项目当中不应该出现 src 目录,Go 和 Java 不同,在 Go 中每一个目录都是一个包,每一个包都是一等公民,我们不需要将项目代码放到 src 当中,不要用写其他语言的方式来写 Go

utils,common

不要在项目中出现 utils 和 common 这种包,如果出现这种包,因为我们并不能从包中知道你这个包的作用,长久之后这个包就会变成一个大杂烩,所有东西都往这里面扔。
有的同学这个时候会问说,那我们的工具函数应该放到哪里?怎么放?
举个例子,我们当前使用 gin 作为路由框架,但是 gin 的 handler 注册其实不是很方便,所以我们做了一层封装,这个时候这个工具方法我们一般放在 /pkg/ginx 目录下,表示这个是对 gin 增强的包,不直接使用 gin 作为包名的原因是因为我们在项目中也会引用 gin 相同的命名一个是会导致误解,另一个是在同时导入的时候也会需要去进行重命名会比较麻烦

关于项目目录结构这种真的算是见仁见智,不同的理论有不同的方法,但是我觉得有两件事比较重要,就服务应用而言需要灵活应用,就基础库而言一定要统一,做的好不好和要不要做是两件事情,如果因为当前做的不够好而不做,那么越到后面就越做不了。
下一篇文章会讲一讲依赖注入框架 wire 的使用与最佳(?)实践

关注我获取更新

看到这里了还不关注点赞走一波

  • 博客 可以订阅 RSS,也可以点击首页通过 webpush 订阅浏览器消息
  • Github Follow me
  • 知乎 关注账号,顺便点个 👍
  • 开发者头条 订阅订阅号,顺便点个 👍

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK