该想法最初起源于我将飞书云文档作为博客的书架页面的数据来源，相关博客请参见《用飞书多维文档打造博客书架页—支持 GitHub Actions 自动更新》; 没想到前两天就有客户循着这篇文章找到我，希望定制一个外贸电商站点，并将站点名、Logo、轮播图、商品与分类等全量数据统一托管在飞书云文档里，让网站只做渲染与交付。换句话说：把飞书云文档用作 无头 CMS（Headless CMS）/ 解耦 CMS（Decoupled CMS） 的数据源。

在整个流程里，飞书多维表格、Github Action 和 Vercel 部署网站都是可以白嫖零成本的，整个项目唯一的花费可能就是域名的购买与续租成本。

有类似需求但没时间/精力研究的读者也欢迎来私信我，我还想继续恰钱

一、项目主要思路与架构设计#

项目的核心架构分为三个部分：数据源（飞书多维表格、同步脚本（Python）） 和 前端渲染（Astro）框架。数据由 GitHub Action 定期拉取到 repo 仓库中，并交由 Vercel 触发执行重新部署到公网上。

1.数据源：飞书多维表格#

用户所有的动态内容都存储在飞书的一个多维表格应用中。我们为不同类型的数据创建了独立的表格，例如：

网站信息表 (site_homepage)：存储网站名称、Logo、全局 SEO 设置等。
首页轮播图表 (banner)：管理首页 Banner 的图片、链接和排序。
商品信息表 (product)：包含商品标题、价格、图片、详情、分类关联等。
商品分类表 (category)：定义商品的分类信息。

这种方式让客户可以像编辑电子表格一样，直观地管理整个网站的内容，无需接触任何代码。

我发现在飞书 Wiki/知识库中直接创建的多维表格，其 API 权限限制比云盘中创建的复杂得多。尤其是在知识库创建的多维表格里，根本无法直接获取表格 ID，当时差点被气死。最后我干脆直接在云盘中创建多维表格，省心省力，变量获取也方便。建议看到这里的朋友直接在飞书云盘中建表，少走弯路。

2.同步脚本：采用 Github Action 来自动、定期执行#

我们使用 Python 脚本来完成数据从飞书到本地 json 文件的迁移。

所有脚本都依赖于一个共享模块 feishu_common.py，它封装了通用逻辑：

认证：通过 APP_ID 和 APP_SECRET 获取 API 操作所需的 tenant_access_token。
API 封装：提供了 list_records 函数，用于获取指定表格的全部记录，并自动处理了分页。
文件下载：关键的 download_feishu_file 函数。飞书中的图片/附件有访问权限，无法直接在网站上使用。该函数负责携带 token 下载这些文件，根据其内容和来源为其生成一个稳定的、唯一的本地文件名，存入 public/images/feishu/ 目录下，并返回一个可在网站上公开访问的相对路径，如 /images/feishu/product/xxx.jpg。
数据写入：write_json_file 函数将处理好的数据写入到 src/data/ 目录下的对应 JSON 文件中。

每个具体的数据同步脚本（如 sync_products.py）都遵循清晰的三步流程：

提取 (Extract)：调用 feishu_common.fetch_records 从飞书 API 获取原始数据。
转换 (Transform)：这是最核心的一步。脚本将飞书返回的原始、复杂的 JSON 结构，转换为前端友好、结构扁平清晰的数据格式。例如，在 transform_products 函数中，它会：
- 遍历商品记录。
- 调用 download_feishu_file 处理商品图片。
- 从关联的分类信息中提取出分类名称，并生成一个用于 URL 的 categorySlug。
- 组合成一个结构化的商品对象。
加载 (Load)：调用 write_json_file 将转换后的数据列表保存为本地的 products.json 文件。

3.前端渲染：纯粹的数据展示层#

前端采用 Astro 框架。得益于解耦架构，Astro 项目本身完全不知道飞书的存在。它的任务非常纯粹，即在构建时（或服务器端渲染时），直接读取 src/data/ 目录下的 products.json、categories.json 等文件，将这些本地数据作为信源，渲染出商品列表页、详情页等静态页面，页面中引用的图片路径，就是同步脚本生成并保存在 public/ 目录下的本地图片。

当客户在飞书更新内容后，只需重新运行一次同步脚本 (sh scripts/sync_all.sh)，即可拉取最新数据。随后重新部署 Astro 站点，网站内容便完成了更新。整个过程实现了内容管理与网站代码的完全分离。

二、具体示例代码#

出于最基本的商业道德和个人操守，飞书表格和具体的隐私内容就不在这里展示了

1.`feishu_common.py`通用共享模块#

1
"""
2
飞书数据同步共享模块
3
包含所有通用的、可复用的代码，如 API 配置、token 管理、文件下载、JSON 写入等函数。
4
"""
5

6
import os, json, pathlib, requests, time, re
7
from urllib.parse import urlparse
8

9
# === 0. 基础配置（强烈建议用环境变量读取） ===
10
APP_ID     = os.getenv("FEISHU_APP_ID",     "")
11
APP_SECRET = os.getenv("FEISHU_APP_SECRET", "")
12
BASE_URL   = "https://open.feishu.cn"
13
SITE_DATA_DIR = pathlib.Path(__file__).parent.parent / "src" / "data"
14
FEISHU_IMAGE_DIR = pathlib.Path(__file__).parent.parent / "public" / "images" / "feishu"
15

16
TABLES = {
17
    "site_homepage": dict(cn_name="网站首页",   app="", tbl=""),
18
    "banner":        dict(cn_name="首页轮播图", app="", tbl=""),
19
    "category":      dict(cn_name="商品分类",   app="", tbl=""),
20
    "product":       dict(cn_name="商品信息",   app="", tbl=""),
21
}
22

23
# === 1. 飞书 API 封装 ===
24

25
def get_tenant_token() -> str:
26
    """获取 tenant_access_token"""
27
    url  = f"{BASE_URL}/open-apis/auth/v3/tenant_access_token/internal"
28
    body = {"app_id": APP_ID, "app_secret": APP_SECRET}
29
    r = requests.post(url, json=body, timeout=10)
30
    r.raise_for_status()
31
    return r.json()["tenant_access_token"]
32

33
def list_records(app_token: str, table_id: str, token: str, sort_field: str = None):
34
    """获取一个表的所有记录（会自动处理分页）"""
35
    all_records = []
36
    page_token = ""
37
    while True:
38
        params = {"page_size": 500}
39
        if page_token:
40
            params["page_token"] = page_token
41

42
        # 添加排序参数，按照记录创建时间或指定字段排序
43
        if sort_field:
44
            params["sort"] = f'[{{"field_name":"{sort_field}","desc":false}}]'
45

46
        url = f"{BASE_URL}/open-apis/bitable/v1/apps/{app_token}/tables/{table_id}/records"
47
        headers = {"Authorization": f"Bearer {token}"}
48
        r = requests.get(url, headers=headers, params=params, timeout=30)
49
        r.raise_for_status()
50
        resp_data = r.json()
51

52
        if resp_data.get("code", 0) != 0:
53
            print(f"Error from Feishu API: {resp_data.get('msg')} (code: {resp_data.get('code')})")
54
            # 打印一些上下文帮助调试
55
            print(f"  → Request URL: {r.request.url}")
56
            print(f"  → App Token used: {app_token}")
57
            print(f"  → Table ID used: {table_id}")
58
            break
59

60
        data = resp_data.get("data", {})
61
        items = data.get("items", [])
62
        if items:
63
            all_records.extend(items)
64

65
        if data.get("has_more"):
66
            page_token = data.get("page_token")
67
        else:
68
            break
69
        time.sleep(0.2) # 避免频率超限
70
    return all_records
71

72
def download_feishu_file(url: str, token: str, table_name: str) -> str | None:
73
    """
74
    从飞书下载文件并保存到本地。
75
    返回可公开访问的 URL 路径。
76
    """
77
    if not url:
78
        return None
79

80
    headers = {"Authorization": f"Bearer {token}"}
81

82
    try:
83
        with requests.get(url, headers=headers, stream=True, timeout=30) as r:
84
            r.raise_for_status()
85

86
            parsed_url = urlparse(url)
87
            file_token = parsed_url.path.split('/')[-2]
88

89
            content_disposition = r.headers.get('Content-Disposition', "")
90
            filename_match = re.search(r'filename="(.+)"', content_disposition)
91

92
            original_filename = ""
93
            if filename_match:
94
                original_filename = filename_match.group(1)
95
                # 确保文件名有扩展名
96
                if not pathlib.Path(original_filename).suffix:
97
                    content_type = r.headers.get('Content-Type', 'image/png')
98
                    extension = f".{content_type.split('/')[-1]}"
99
                    original_filename += extension
100
            else:
101
                content_type = r.headers.get('Content-Type', 'image/png')
102
                extension = f".{content_type.split('/')[-1]}"
103
                original_filename = f"download{extension}"
104

105
            # 清理文件名，防止路径问题
106
            safe_filename = re.sub(r'[\\/*?:"<>|]', "", original_filename)
107
            local_filename = f"{file_token}-{safe_filename}"
108

109
            table_image_dir = FEISHU_IMAGE_DIR / table_name
110
            table_image_dir.mkdir(exist_ok=True, parents=True)
111
            save_path = table_image_dir / local_filename
112

113
            with open(save_path, 'wb') as f:
114
                for chunk in r.iter_content(chunk_size=8192):
115
                    f.write(chunk)
116

117
                print(f"  → Downloaded {url} to {save_path}")
118

119
                return f"/images/feishu/{table_name}/{local_filename}"
120
    except requests.exceptions.HTTPError as e:
121
        if e.response.status_code == 403:
122
             print(f"  → Error 403: Forbidden to download file from {url}. "
123
                   f"Please ensure the app has 'drive:file:readonly' permission and the file is shared correctly.")
124
        else:
125
            print(f"  → An HTTP error occurred: {e}")
126
        return None
127

128
# === 2. 辅助函数 ===
129

130
def write_json_file(data: any, filename: str):
131
    """将数据写入指定的 JSON 文件"""
132
    outfile = SITE_DATA_DIR / filename
133
    outfile.parent.mkdir(parents=True, exist_ok=True)
134
    outfile.write_text(json.dumps(data, ensure_ascii=False, indent=2), encoding="utf-8")
135

136
    count_info = ""
137
    if isinstance(data, list):
138
        count_info = f" ({len(data)} items)"
139
    print(f"✔ Generated {outfile}{count_info}")
140

141
def fetch_records(table_key: str, token: str, sort_field: str = None) -> list:
142
    """根据 table key 获取一个表的所有记录"""
143
    table_info = TABLES[table_key]
144
    print(f"Fetching {table_info['cn_name']}...")
145
    records = list_records(table_info["app"], table_info["tbl"], token, sort_field)
146
    print(f"  → Fetched {len(records)} records.")
147
    return records

2.具体数据同步脚本：以 `sync_products.py`为例#

其他模块这里就不再展示了。

1
"""
2
同步飞书中的“商品信息”到本地的 products.json
3
"""
4

5
import feishu_common as fc
6

7
def transform_products(records: list, token: str) -> list:
8
    """
9
    转换商品数据。
10
    将飞书多维表格的原始记录列表，转换为网站所需的商品数据列表。
11
    """
12
    data = []
13
    for index, r in enumerate(records):
14
        f = r["fields"]
15

16
        # 下载图片并获取本地路径
17
        local_images = []
18
        if f.get("商品图片"):
19
            # 反转图片列表，让最新上传的图片排在最前面
20
            for img in reversed(f.get("商品图片", [])):
21
                if img.get("url"):
22
                    local_path = fc.download_feishu_file(img["url"], token, "product")
23
                    if local_path:
24
                        local_images.append(local_path)
25
        elif f.get("商品图片网址"):
26
            # 如果没有上传图片，则使用图片网址
27
            image_urls = f.get("商品图片网址", "").split(',')
28
            # 按录入顺序展示（不倒序）
29
            for url in image_urls:
30
                local_images.append(url.strip())
31

32
        # 将分类名称转换为slug格式
33
        category_name = f.get("商品分类", [{}])[0].get("text", "")
34
        category_slug = category_name.lower().replace(" ", "-").replace("&", "").replace(",", "").strip()
35

36
        data.append({
37
            "title": f.get("商品标题"),
38
            "tags": f.get("打标", []),
39
            "categorySlug": category_slug,
40
            "categoryName": category_name,  # 保留原分类名称用于显示
41
            "seo": {
42
                "title": f.get("商品标题title"),
43
                "keywords": ", ".join(f.get("商品keywords", [])),
44
                "description": f.get("商品详情"),
45
            },
46
            "slug": f.get("商品slug"),
47
            "images": local_images,
48
            "sku": f.get("货号"),
49
            "price": f.get("商品价格"),
50
            "details": f.get("商品详情"),
51
            "amazonLink": f.get("亚马逊购买链接"),
52
            "createdAt": index,  # 使用记录在列表中的索引作为排序依据，索引越大表示越新
53
        })
54

55
    # 按索引倒序排序，表格末尾（索引大）的商品在前面，实现最新商品在前
56
    data.sort(key=lambda x: x.get("createdAt", 0), reverse=True)
57
    return data
58

59
def main():
60
    """主执行函数"""
61
    # 1. 获取 token
62
    token = fc.get_tenant_token()
63

64
    # 2. 提取 (Extract)
65
    product_records = fc.fetch_records("product", token)
66

67
    # 3. 转换 (Transform)
68
    products_data = transform_products(product_records, token)
69

70
    # 4. 加载 (Load)
71
    fc.write_json_file(products_data, "products.json")
72

73
if __name__ == "__main__":
74
    main()

3.Github Action 定期同步脚本#

1
name: Sync Data from Feishu
2

3
on:
4
  schedule:
5
    - cron: '0 0 * * *'
6
  workflow_dispatch:
7

8
jobs:
9
  sync_data:
10
    runs-on: ubuntu-latest
11
    permissions:
12
      contents: write
13
    steps:
14
      - name: Checkout code
15
        uses: actions/checkout@v4
16

17
      - name: Set up Python
18
        uses: actions/setup-python@v4
19
        with:
20
          python-version: '3.10'
21

22
      - name: Install dependencies
23
        run: |
24
          python3 -m venv .venv
25
          .venv/bin/pip install requests
26

27
      - name: Execute sync script
28
        env:
29
          FEISHU_APP_ID: ${{ secrets.FEISHU_APP_ID }}
30
          FEISHU_APP_SECRET: ${{ secrets.FEISHU_APP_SECRET }}
31
        run: bash ./scripts/sync_all.sh
32

33
      - name: Update deployment timestamp
34
        run: |
35
          echo "Last sync: $(date -u '+%Y-%m-%d %H:%M:%S UTC')" > LAST_SYNC.md
36
          echo "Workflow run: ${{ github.run_number }}" >> LAST_SYNC.md
37
          echo "Trigger: ${{ github.event_name }}" >> LAST_SYNC.md
38

39
      - name: Commit and push changes
40
        uses: stefanzweifel/git-auto-commit-action@v5
41
        with:
42
          commit_message: 'Automated: Sync data from Feishu'
43
          file_pattern: 'src/data/*.json public/images/feishu/**/*.* LAST_SYNC.md'

Astro 模板的数据源改造等相关事宜这里就不再赘述，不同模板/项目的思路各不相同。

三、总结#

对于客户而言，他们获得了一个无需任何技术背景、像编辑 Excel 一样直观的内容管理后台。增删商品、更换轮播图、调整网站文案，都只是在熟悉的表格里填填改改，学习成本几乎为零。

对于我（开发者）而言，前端（Astro）与数据源（飞书）完全分离。我只需要关心如何优雅地展示 JSON 数据，而无需为内容管理系统的开发、部署和维护操心。这种分工让整个项目的迭代和维护变得异常清晰和高效。

从最初用飞书管理个人书架，到现在支撑起了一个完整的电商网站，这套飞书多维表格数据源+Github Action+Astro框架等静态站点的方案无疑展现了其高度的灵活性。它证明了我们可以利用手边成熟、易用的工具，通过一点胶水代码，创造出专业、稳定且对非技术人员极其友好的解决方案。

当然，虽然目前的方案已经能比较好地满足需求，但仍然有不少值得优化的方向：

1.实现增量同步与缓存机制#

目前的同步脚本每次都是全量拉取所有数据，并重新下载所有图片。当商品数量和图片文件越来越多时，每次构建都会消耗不必要的时间和 GitHub Actions 的资源。在下载图片前，可以先检查本地是否已存在同名（基于飞书 file_token 生成的稳定文件名）的文件。如果存在，就跳过下载，直接复用本地路径。这是最容易实现的优化点。

2.强化系统鲁棒性，增加数据校验层#

我们现在完全信任客户在飞书表格中输入的数据格式。如果客户不小心在价格字段填入了文本（如 100元），或者在必填项留空，可能会导致前端页面渲染出现小问题。可以在 Python 脚本的“转换 (Transform)”环节，引入 Pydantic 之类的库。为每种数据类型（如商品、分类）定义一个数据模型，明确字段类型、是否必填等规则。在转换后、写入 JSON 文件前进行校验，如果数据不合规，可以打印详细的错误日志，方便快速定位问题，甚至可以中止构建并发送通知。

3.这套 Python 脚本的设计能否更加优雅？#

目前各表同步仍然依赖在Python中直接指定具体的分列；能否将其他的具体数据同步脚本实现 all in one，实现更优雅、更统一、更集中的数据保存机制？

4.引入 Webhook 实现实时更新#

cron 定时任务虽然稳定，但不够实时。客户更新内容后，最长可能需要等待 24 小时才能在网站上看到效果，或者需要用户手动去触发 workflow_dispatch。可以利用飞书开放平台的事件订阅功能，配置一个 Webhook。当指定的飞书表格发生内容变更时，飞书会主动向一个指定的 URL（例如 GitHub Actions 的 repository_dispatch webhook 地址）发送通知，从而自动触发同步工作流，这将带来近乎实时的更新体验。