# getaiemail 更新版数据证据包｜2026-06-02 rerun-1700

结论：🟡 数据链路从原 `1/7 full + 1 partial + 5 missing` 提升为「可做有限复盘，但不可 Scale 归因」。GSC、Bing Webmaster、Ahrefs Site Audit、D1 event_records 已补出关键证据；Plausible 前端与事件请求已通；但 GA4 与 Clarity 仍未接入 runtime，Plausible 后台/API 仍 401，真实 UTM/distribution log 仍不足。

风险：GA4/Clarity 缺失仍是复盘级硬缺口；Bing 仍 Processing、GSC indexed=0、Ahrefs crawl 被 1 internal page cap 限制，只能作为补齐后的早期证据，不代表搜索/行为/渠道已闭环。

动作：暂不恢复规模化外部分发。可以恢复「小规模、带 UTM、带 distribution log 的验证分发」，前提是每条链接都记录 source_url/utm/referrer，并等墨析下一轮在 D1/Plausible/GSC/Bing 中复核。

## Metadata

```json
{
  "review_date": "2026-06-02",
  "checked_at_utc": "2026-06-02T13:30:09Z",
  "project_slug": "getaiemail",
  "production_url": "https://getaiemail.com/",
  "topic_target": "telegram:-1003750190535:7658",
  "compared_to_original_task": "t_99aff37d",
  "original_coverage": "1/7 full + 1 partial + 5 missing",
  "updated_coverage_summary": "2 full + 5 partial + 2 missing across 9 reviewed sources",
  "data_chain_gate_status": "partial_pass_with_core_watch_items",
  "can_resume_external_distribution": "limited_utm_test_only_not_scale",
  "missing_data_sources": ["GA4 runtime/API/backend data", "Clarity runtime/dashboard recordings"],
  "partial_data_sources": ["Plausible backend stats API", "GSC performance rows/indexing", "Bing sitemap processing/discovered counts", "Ahrefs full-site crawl", "UTM/distribution log"],
  "full_data_sources": ["D1 funnel/event_records", "Technical SEO/public crawl"],
  "required_events_checked": ["tool_start", "tool_result", "copy_draft", "pricing_cta_click", "checkout_start", "scenario_nav_click"],
  "evidence_dir": "/root/.hermes/kanban/boards/site-review/artifacts/site-review-20260602-rerun-1700/evidence-getaiemail-updated/"
}
```

## 覆盖矩阵

### 1. Plausible：🟡 Partial

事实：
- 生产 HTML / runtime 已观察到 Plausible：`typeof window.plausible === function`。
- script：`https://plausible.io/js/script.js`。
- 浏览器交互后出现 `https://plausible.io/api/event` 请求。
- 事件请求中可见 `tool_start`、`tool_result`、`pricing_cta_click`、`scenario_nav_click`，并带 props：`utm_source`、`utm_medium`、`utm_campaign`、`referrer`、`landing_path`、`scenario`、`path` 等。
- API：`https://plausible.io/api/v1/stats/*?site_id=getaiemail.com` 使用当前 `PLAUSIBLE_API_KEY` 返回 401：`Invalid API key or site ID`。

判断：前端上报链路可验；后台 stats / UV / 来源 / goal breakdown 仍不可查，不能把 Plausible 计为 full。

### 2. GA4：🔴 Missing

事实：
- 浏览器 runtime：`typeof window.gtag === undefined`，`window.dataLayer === null`。
- resources 未观察到 `googletagmanager` / `google-analytics` / `collect`。
- Google OAuth token 可用，Analytics Admin API 200；但可见 GA4 property list 中没有 getaiemail property。

判断：GA4 仍未接入生产 runtime，也没有可查 GA4 property。原 P1 未闭环。

### 3. Clarity：🔴 Missing

事实：
- 浏览器 runtime：`typeof window.clarity === undefined`。
- resources/scripts 未观察到 `clarity.ms`。
- 本轮无 getaiemail Clarity dashboard sessions/users/dead clicks/JS errors 证据。

判断：Clarity 仍未接入。原 P1 未闭环。

### 4. GSC：🟡 Partial（权限已补齐，数据仍早期）

事实：
- Google OAuth token exchange：200。
- GSC Sites API：`sc-domain:getaiemail.com` 存在，permissionLevel=`siteOwner`。
- Sitemap：`https://getaiemail.com/sitemap.xml` 已提交；`lastSubmitted=2026-06-02T12:56:18.868Z`；`lastDownloaded=2026-06-02T12:56:20.408Z`；`isPending=false`；warnings=0；errors=0。
- GSC sitemap contents：submitted=13，indexed=0。
- Search Analytics pages/queries 7d：API 200，但无 rows，仅返回 aggregation type。
- 上游 backfill URL Inspection：13 个 sitemap URL 中 homepage indexed=1，5 discovered-not-indexed，7 unknown。

判断：GSC 权限/提交 blocker 已解；但 indexed 和 search performance 仍未形成有效表现数据。

### 5. Bing Webmaster：🟡 Partial

事实：
- 浏览器 UI 当前站点：`getaiemail.com/`。
- Known sitemaps=1；errors=0；warnings=0。
- Sitemap row：`https://getaiemail.com/sitemap.xml`，Last submit=2026-06-02，Status=`Processing`。
- Total URLs discovered=0；Last crawl=`-`。

判断：Bing property 和 sitemap 提交已补齐；仍需等 Processing 清空后复查 discovered/indexed/crawl。

### 6. Ahrefs Site Audit：🟡 Partial

事实（来自已完成 backfill durable artifact）：
- Project：Getaiemail / getaiemail.com。
- Ownership：Verified。
- Crawl：Completed。
- Health score：86%。
- URLs crawled：1。
- Internal pages max：1。
- Top issues：Orphan page=1、Pages to submit to IndexNow=1、Page in multiple sitemaps=1。

判断：Ahrefs Site Audit 从 missing 变成可查；但 crawl cap=1，只能算首跑烟测，不能代表全站 13 URL 审计。

### 7. D1 funnel / events：🟢 Full for backend event evidence

事实：
- D1 database：`getaiemail-db` 可查。
- Tables：`users`、`generations`、`usage_records`、`orders`、`subscriptions`、`event_records`、`webhook_events`。
- Counts：users=1；generations=10；usage_records=38；orders=6；subscriptions=0；event_records=27；webhook_events=2。
- generations：succeeded Follow-up=8；failed Follow-up=2。
- orders：paid pro monthly=1，sum_total=999；pending pro annual=3；pending pro monthly=2。
- event_records summary：
  - tool_result=7
  - tool_start=7
  - scenario_nav_click=5
  - copy_draft=3
  - pricing_cta_click=2
  - checkout_start=1
  - login_click=1
  - variant_click=1
- event_records schema includes attribution columns：`landing_path`、`referrer`、`utm_source`、`utm_medium`、`utm_campaign`、`scenario`、`plan`、`billing`、`metadata`。

判断：本任务要求验证的 6 个新事件均已在 D1 或浏览器上报链路中出现；D1 后端事件证据完整。但当前很多记录是 QA/墨析测试行为，不能直接当真实用户转化。

## 新事件验收

- `tool_start`：🟢 浏览器 Plausible event + `/api/events` beacon + D1 `event_records` 均可查；携带 `scenario`、`landing_path`、UTM/referrer 字段。
- `tool_result`：🟢 浏览器 Plausible event + `/api/events` beacon + D1 可查；携带 `scenario`、`mode`、`landing_path`、UTM/referrer 字段。
- `copy_draft`：🟢 D1 可查 3 条，`mode=subject/body`，携带 `scenario`、`landing_path`、UTM/referrer 字段。
- `pricing_cta_click`：🟢 浏览器 Plausible event + `/api/events` beacon + D1 可查；携带 `plan=pro`、`billing=annual`、`target_path=/checkout?billing=annual`、`landing_path`、UTM/referrer 字段。
- `checkout_start`：🟡 D1 可查 1 条，携带 `plan=pro`、`billing=annual`、`landing_path=/checkout`、`referrer=https://getaiemail.com/professional-email-generator`；本轮浏览器未复现到 Stripe 发起前完整事件链，需后续窄口径复测 checkout 页按钮但不能进入真实支付。
- `scenario_nav_click`：🟢 浏览器 Plausible event + `/api/events` beacon + D1 可查；携带 `scenario`、`target_path`、`landing_path`、UTM/referrer 字段。

## UTM / distribution log：🟡 Partial / weak attribution

事实：
- 前端事件 props 和 D1 schema 已支持 `utm_source`、`utm_medium`、`utm_campaign`、`referrer`、`landing_path`。
- D1 recent rows 多数 UTM 为空/null；部分 referrer 是站内路径。
- 本轮未找到可证明真实外部分发的 distribution/cold-start log；web search `"getaiemail.com" -site:getaiemail.com` 未发现有效 listing/community/newsletter 外链，只返回 DNS/IP 噪声和无关 CSDN 页面。

判断：埋点字段补上了，但真实分发归因未补上。外部分发只能小规模带 UTM 验证，不能加码。

## Technical SEO：🟢 Full

事实：
- Homepage：200。
- `/robots.txt`：200，Allow `/`，Disallow `/resignation-email-generator`、`/login`、`/checkout`，Sitemap 指向 `https://getaiemail.com/sitemap.xml`。
- `/sitemap.xml`：200，13 URLs。
- `/api/health`：200，`ok=true`，db/ai/stripe=true。
- `/indexnow.txt`：200。
- Homepage title：`AI Email Generator for Work Emails | getaiemail`。
- canonical：`https://getaiemail.com`。
- Ahrefs meta verification present in HTML（backfill 已验证 ownership）。

判断：公开抓取、sitemap、IndexNow key、基础 SEO 件可查。

## 从原 t_99aff37d 的变化

已补齐：
- GSC：从无 access → domain property siteOwner，sitemap submitted/downloaded，URL Inspection 有证据。
- Bing：从未验证 → property/import + sitemap Processing。
- Ahrefs：从 no project → Site Audit project verified + completed first crawl。
- D1 events：从只有业务表/usage 部分 → `event_records` 明确包含新事件和归因字段。
- Plausible：从原数据包写前端 absent，更新为 Plausible runtime/function + event requests 可见。

仍未补齐：
- GA4 runtime/property。
- Clarity runtime/dashboard。
- Plausible backend stats API/UI 权限。
- Bing discovered/indexed/crawl 数据。
- GSC search performance rows / indexed count。
- Ahrefs full-site crawl cap。
- 真实 UTM distribution log / 外部分发归因。

## Evidence files

- `/root/.hermes/kanban/boards/site-review/workspaces/t_a2608b5c/evidence/technical_http.json`
- `/root/.hermes/kanban/boards/site-review/workspaces/t_a2608b5c/evidence/browser_runtime_events.json`
- `/root/.hermes/kanban/boards/site-review/workspaces/t_a2608b5c/evidence/evidence_plausible.json`
- `/root/.hermes/kanban/boards/site-review/workspaces/t_a2608b5c/evidence/evidence_google.json`
- `/root/.hermes/kanban/boards/site-review/workspaces/t_a2608b5c/evidence/evidence_d1.txt`
- Durable evidence mirror：`/root/.hermes/kanban/boards/site-review/artifacts/site-review-20260602-rerun-1700/evidence-getaiemail-updated/`
