V2EX › 程序员

挑战：用正则表达式将整个 MarkDown 文件按照标题#拆分成子字符串

AndyAO · 1 天前 · 400 次点击

也就是按照标题进行拆分，将每个标题 1，及其下辖内容，变成独立的字符串。

由于是挑战的性质，所以要求只调用正则表达式引擎 1 次就完成任务。

怎么才算赢呢？只要指出优越性就行，也许是性能，也许是可读性。

如果你想挑战的话可以试试看。

至于我的答案嘛，就放在最后了。

如果放 Match 对象，那么又要重复原文内容，这里放个图吧。

戳此查看

# 0

Content 0

## 0.0

Content 0.0

### 0.0.0

Content 0.0.0

#### 0.0.0.0

Content 0.0.0.0

### 0.0.1

Content 0.0.1

### 0.0.2

Content 0.0.2

## 0.1

Content 0.1

## 0.2

### 0.2.0

Content 0.2.0

### 0.2.1

Content 0.2.1

## 0.3

# 2

Content 2

# 3

Content 3

# 4

Content 4

我的答案是这样的，用捕获组是为了提取，也是为了加个分隔和注释，方便阅读。

C#的正则引擎对各种高级特性支持都比较好，我平常又比较常用，所以用的是这个。

断言在某些引擎上运行可能会失败，不要高估了正则表达式在不同引擎上的兼容性。

^(?<TitleSymbol>#)( )(?<Title>.+)(\n)(?<Content>[\s\S]+?)((?=(\n# ))|(?![\s\S]))

挑战：用正则表达式将整个 MarkDown 文件按照标题#拆分成子字符串

挑战：用正则表达式将整个 MarkDown 文件按照标题#拆分成子字符串

Recommend

基于 OSS+CDN 的服务如何向用户收取流量以及存储费用呢

android studio 添加 gradle 配置 jackOpions{enable true}后，字符串被混淆

对于程序员来讲 MAC OS 真的比 Windows 和 Linux 更加有生产力？

Go 实现的固定 routine pool, 挂掉重新拉起新 routine

Steam 串流如何串附带 Launcher 的游戏?

大家在开发环境配置上一般会花多长时间？

面试经典题目--买卖股票的最佳时机

酷睿 i5 7 代表示不支持 win11

苹果审核 ipv6 的问题

gitlab 多域名 ddns 配置

About Joyk