Dify + Cloudflare Tunnel 部署指南

Posted on Thu 09 October 2025 in 开发工具 • Tagged with Dify, Cloudflare, Tunnel, Docker, 部署

本指南详细介绍如何使用 Docker 部署 Dify,并通过 Cloudflare Tunnel 实现安全的外网访问。

前置条件

  • macOS 系统
  • 已安装 Docker 和 Docker Compose
  • 拥有 Cloudflare 账户
  • 拥有一个域名并托管在 Cloudflare

第一步:部署 Dify

1.1 克隆 Dify 仓库

cd /Users/heyaohua/Server
git clone https://github.com/langgenius/dify.git
cd dify/docker

1.2 配置环境变量

# 复制环境变量模板
cp .env.example .env

# 编辑环境变量文件
vim .env

关键配置项: - SECRET_KEY: 生成一个安全的密钥 - DB_USERNAME, DB_PASSWORD: 数据库用户名和密码 - REDIS_PASSWORD: Redis 密码

1.3 启动 Dify 服务

# 启动所有服务 …

Continue reading

MySQL→PostgreSQL 主从架构迁移方案(读写分离版)

Posted on Thu 09 October 2025 in 数据库 • Tagged with PostgreSQL, MySQL, 迁移, 读写分离, 高可用

目标:用 PostgreSQL 的 WAL + Streaming Replication 实现“写走主、读走从”,并提供生产可用的高可用与连接层方案,附配置模板与运维脚本示例。适配 PostgreSQL 16/17/18。


1. 架构总览

1.1 基础拓扑(最小可用)

App(写) ─────────►  Primary(主)
                ╲
                 ╲ WAL Stream
                  ╲
App(读) ───────────► Standby1(从)
                   ► Standby2(从)
  • 写请求:直连主库。
  • 读请求:直连从库(或通过中间层,见 §4)。
  • 主从:物理复制(Streaming Replication),异步或半同步可选。

1.2 生产级拓扑(推荐)

               +-------------------+
               |    pgbouncer      |  连接池(减少连接抖动)
               +-------------------+
                        │
                 +--------------+
                 |   Pgpool-II  |  SQL解析级读写分离/健康检查/故障转移脚本
                 +--------------+
                     │     │
                (Write)   (Read)
                     │     │
                   Primary  ──┬── Standby1
                              └── Standby2

        +-------------------+
        | Patroni + etcd    |  主从编排/自动 …

Continue reading

PostgreSQL Docker 部署常见问题与解决方案

Posted on Thu 09 October 2025 in 数据库 • Tagged with PostgreSQL, Docker, 故障排查, FAQ

汇总在使用 Docker 部署 PostgreSQL(含 PostGIS、pgvector、TimescaleDB)过程中常见的问题及可操作的解决方案,涵盖构建、扩展、连接、权限、性能与数据等方面。


目录

  • 构建问题
  • 扩展问题
  • 连接问题
  • 权限问题
  • 性能问题
  • 数据问题
  • 调试技巧
  • 预防措施
  • 获取帮助

构建问题

Q1: Docker 构建时出现 "lsb_release: command not found"

问题描述:

/bin/sh: 1: lsb_release: command not found
/bin/sh: 1: apt-key: command not found

原因分析: 在 Debian/Ubuntu 基础镜像中,lsb_releaseapt-key 命令可能不存在或已被弃用。

解决方案:改用从源码编译的方式 …


Continue reading

PostgreSQL Docker 部署指南

Posted on Thu 09 October 2025 in 数据库 • Tagged with PostgreSQL, Docker, PostGIS, pgvector, TimescaleDB

本指南详细介绍如何使用 Docker 部署一个包含 PostGIS、pgvector 和 TimescaleDB 扩展的 PostgreSQL 15 数据库。该方案解决了扩展兼容性问题,特别是 pgvector 的段错误问题。

项目结构

PgSQL/
├── .env                          # 环境变量配置
├── Dockerfile                    # PostgreSQL 镜像构建文件
├── docker-compose.yml            # Docker Compose 配置
├── README.md                     # 项目说明
├── config/                       # 配置文件目录
│   ├── pg_hba.conf              # 客户端认证配置
│   └── postgresql.conf          # PostgreSQL 主配置
├── data/                        # 数据持久化目录
│   └── pgdata/                  # PostgreSQL 数据目录
├── init-scripts/                # 初始化脚本
│   └── 01-install-extensions.sql # 扩展安装脚本
├── logs/                        # 日志目录
└── test-examples.sql            # 测试示例

快速开始

1. 环境准备

确保系统已 …


Continue reading

淘宝自动化框架选择方案

Posted on Fri 26 September 2025 in 开发工具 • Tagged with Python, 自动化测试, DrissionPage, Playwright, Selenium

淘宝自动化框架选择方案

🎯 推荐方案:DrissionPage + 现有架构

为什么选择 DrissionPage?

  1. 专为中国网站设计
  2. 针对淘宝、京东等电商网站优化
  3. 内置常见反爬虫机制绕过
  4. 国产框架,中文文档完善

  5. 与现有架构完美融合

  6. 可以直接使用现有的 requests session
  7. 支持与 mitmproxy 代理集成
  8. 兼容现有的数据处理管道

  9. 性能与易用性并存

  10. 基于 Chromium 内核,性能优秀
  11. API 设计简洁直观
  12. 支持页面模式和 requests 模式切换

📊 框架对比分析

特性 DrissionPage Playwright Selenium Requests-HTML
性能 很快 最 …

Continue reading

最佳实践:调优 Impala 与 Hive 的资源竞争关系,避免 Impala 查询 OOM

Posted on Tue 09 September 2025 in 大数据 • Tagged with Impala, Hive, 资源调优, OOM, YARN, 集群管理

核心结论: 要有效避免 Impala 查询因资源被批处理(Hive/Tez)占满而导致 OOM,需在集群级和服务级两个维度协同调优,重点在于隔离资源、配置队列及精细化设置查询内存和并发。


一、集群级资源隔离

1. 使用 YARN 容器隔离 Hive(Tez)批处理与 Impala

将 Hive-on-Tez 运行在 YARN 上,通过配置不同的 YARN 队列(Queue)来隔离批处理作业与交互式查询。

示例配置(capacity-scheduler.xml):

<property>
  <name>yarn.scheduler.capacity.root.interactive.capacity</name>
  <value>30</value>
</property>
<property>
  <name>yarn.scheduler.capacity.root.batch.capacity</name>
  <value>70</value>
</property>

如上,Batch 队 …


Continue reading

平台选型指南:Ollama、LM Studio 与 AnythingLLM

Posted on Tue 09 September 2025 in 人工智能 • Tagged with Ollama, LM Studio, AnythingLLM, 平台选型, 本地部署, AI工具

在本地化部署与离线使用场景中,Ollama、LM Studio 与 AnythingLLM 是三款主流平台,它们在模型支持范围易用性性能优化社区生态以及商业许可等方面各有侧重。下表直观对比了三者的关键维度:

📊 平台对比总览

特性 Ollama LM Studio AnythingLLM
模型生态 支持 100+ 开源与闭源模型(如 GPT-OSS、Gemma 3、Llama3.1、DeepSeek 等),可通过 CLI 与 API 一键拉取与切换; 主要整合 Hugging Face 与 Mistral、Phi 3 系列,本地化界面化管理模型; 聚焦社区贡献模型与自定义微调,支持量化 …

Continue reading

如何选择适合的大语言模型

Posted on Mon 08 September 2025 in 人工智能 • Tagged with 大语言模型, 模型选择, AI应用, 技术指南, 模型对比

基于对当前主流大模型的深入了解,以下是针对不同应用场景的模型选择横向总结,方便快速定位适合的模型使用:

📊 大模型选择对照表

应用场景 推荐模型 理由/特点
通用大规模推理、多任务 Qwen3-235B-A22B 参数大,思维模式切换,强推理能力,超长上下文,丰富多语言支持
编程与代码辅助 Qwen2.5-Coder 32B 专业代码生成、修复、推理领先,支持40+语言,接近 GPT-4o 代码能力
长文本与知识增强检索 GPT-OSS 120B 长上下文128K,工具调用 …

Continue reading

Qwen3 系列模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Qwen, 阿里云, MoE架构, 思维模式, Agent集成

核心结论: Qwen3 通过混合专家(MoE)与稠密(Dense)架构并行思维模式切换超长上下文(128K)支持的创新设计,实现了在编程、数学推理、多语言与 Agent 集成等场景下的顶级开源性能;但仍面临高资源需求综合安全管控领域知识深度等挑战。

一、模型概览

Qwen3 系列涵盖 0.6B 至 235B 参数的八个规模模型,分为稠密与 MoE 两类:

  • 稠密模型:0.6B、1.7B、4B、8B、14B、32B,均支持 32K(小型)或 128K(大中型)上下文;
  • MoE 模型:30B-A3B(3B 激活)、235B-A22B(22B 激 …

Continue reading

Phi-3 系列模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Phi-3, Microsoft, 轻量化模型, 长上下文, 边缘计算

核心结论: Phi-3 系列以轻量化高效推理为核心,通过 3B(Mini)与 14B(Medium)两个规模覆盖边缘到中型部署场景,在数学与逻辑推理长上下文理解代码辅助任务上表现优异;其多阶段训练(合成+公开语料+DPO 微调)确保指令遵循与安全性,但在多语言专业领域知识覆盖方面尚需检索增强与微调补强。

一、模型概览

Phi-3 系列包括:

  • Phi-3 Mini(3.8B 参数,4k/128K 上下文,2.2 GB,MIT 许可)
  • Phi-3 Medium(14B 参数,4k/128K 上下文,量化后约 …

Continue reading

Mistral 7B 模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Mistral, 轻量化模型, 高效架构, 函数调用, 开源模型

核心结论: Mistral 7B 以其高效架构卓越性能著称:在"成本/性能"比上相当于三倍规模的 Llama 2,实现对话、推理与代码生成等多场景的优异表现;开源 Apache-2.0 许可与原生函数调用支持,使其成为本地化与云端部署的首选轻量级模型。

一、模型概述

Mistral 7B 采用Grouped-Query Attention (GQA)Sliding Window Attention (SWA)相结合的架构,参数量约7.3B,经 Q4_0 量化后模型大小约4.1 GB,支持标准指令(instruct)与文本补全(text)两种形式,并具备本地化函数调用 …


Continue reading

Llama 3.2 系列模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Llama, Meta, 轻量化模型, 多模态, 边缘计算

核心结论: Llama 3.2 通过 1B/3B 的轻量级文本模型及 11B/90B 的视觉多模态模型组合,实现了在边缘设备视觉理解场景的出色性能;同时保持 128K 超长上下文,适用于对话、摘要、检索图文分析任务。主要不足在于图像分辨率与输出长度限制,以及需要额外整合系统级安全与治理机制。

一、模型概览

Llama 3.2 系列包含:

  • 文本模型:1B 与 3B 参数,优化用于多语言对话、指令跟随、摘要与工具调用;
  • 视觉模型:11B …

Continue reading

Llama 3.1 系列模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Llama, Meta, 开源模型, 长上下文, 多语言支持

核心结论: Llama 3.1 以超长上下文(128K)开源多规模覆盖(8B/70B/405B)多语言能力为主要特征,在通用知识、长文档理解、编码与多语言对话等场景中表现出色;但高端规模推理成本高专业领域深度略逊,以及安全防护需自行完善

一、模型概览

Llama 3.1 包括三种指令调优规模:

  • 8B:4.9 GB,128K 文本上下文;
  • 70B:43 GB,128K 文本上下文;
  • 405B:243 GB,128K 文本上下文。

均使用 Grouped-Query Attention (GQA) 优化,支持多语言输入(8 种主要语言),可本地 …


Continue reading

LLaVA 1.6 模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with LLaVA, 多模态模型, 视觉理解, OCR, 视觉问答

核心结论: LLaVA 1.6 在视觉理解、OCR 与多模态对话方面进一步提升,通过支持高达 672×672 像素的高分辨率输入和改进的视觉指令微调数据,实现了对世界知识与逻辑推理的增强;适用于视觉问答、图文检索与多模态客服等场景,但在极大图像、视频理解与专业领域精准度上仍有提升空间。

一、模型概览

LLaVA(Large Language and Vision Assistant)1.6 基于 Vicuna 文本骨干与 CLIP 视觉编码器,采用 Q4_0 量化的 7B、13B、34B 三种规模变体:

  • 7B 及 …

Continue reading

Gemma 3 模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Gemma, Google, 多模态模型, 长上下文, 轻量化部署

核心结论: Gemma 3 系列以多模态处理超长上下文极低资源消耗为特色,兼顾图像理解与文本生成;在视觉问答、文档理解、多语言翻译等任务上表现优异,但在高阶推理与专业领域深入度上略逊于大型专用模型,且需通过提示工程与检索补强事实准确性。

一、模型概述

Gemma 3 系列由 Google 基于 Gemini 技术研发,包含五种规模:

  • 0.27B、1B 参数:32K 文本上下文;
  • 4B、12B、27B 参数:128K 文本上下文、支持图像输入。

采用量化 …


Continue reading

GPT-OSS 模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with GPT-OSS, 开源模型, MoE架构, 代码生成, 长上下文

核心结论: GPT-OSS 系列模型通过开源权重和本地部署能力,实现了在代码生成与复杂推理任务上的竞品级表现,并借助 128K 长上下文窗口,显著提升了长文本处理能力;但其通用知识覆盖多语言理解较顶尖闭源大模型略逊,同时需要开发者自行强化安全与监控机制以防滥用。

一、模型概述

GPT-OSS 包括两种规模:

  • gpt-oss-120B:约1170亿参数,5.1B 活跃参数/层,量化后模型体积≈60.8 GiB,可跑满128K上下文;
  • gpt-oss-20B:约209 亿参数,3.6B 活跃参数 …

Continue reading

DeepSeek-R1 模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with DeepSeek, 大语言模型, 强化学习, MoE架构, 推理能力

DeepSeek-R1采用MoE架构,总参数671B,通过强化学习实现强大推理能力,在数学、编程等任务上媲美闭源模型。详解其技术架构、性能表现及应用场景。


Continue reading

WordPress 密码重置指南

Posted on Mon 08 September 2025 in 技术 • Tagged with WordPress, 密码重置, 数据库, 安全, 故障排除

🔑 方法1:通过数据库直接重置(最快)

如果您有数据库访问权限,这是最快的方法:

# 进入MySQL容器
docker exec mysql_server mysql -u wordpress_user -p你的密码

# 在MySQL中执行以下命令
USE wordpress_db;

# 查看所有用户
SELECT ID, user_login, user_email FROM wp_users;

# 重置指定用户密码(这里以用户名 heyaohua 为例)
UPDATE wp_users SET user_pass = MD5('新密码') WHERE user_login = 'heyaohua';

# 或者使用更安全的WordPress密码哈希
UPDATE wp_users SET user_pass = '$P$B7TBaFiTTExKUX8aWA.HyNEHKvZQ5P0' WHERE user_login = 'heyaohua';
# 上面的哈希对应密码: admin123

🔑 方法2:通过WordPress文件重置

在WordPress根目录创建重置脚本:

<?php
// 创建文件: reset_password.php
require_once('wp-config.php');
require_once('wp-includes/wp-db.php');

$user_login = 'heyaohua';  // 替换为您的用户名
$new_password = 'new_password_123';  // 替换为新密码

$user = get_user_by('login', $user_login);
if …

Continue reading

WordPress 双语网站搭建指南

Posted on Mon 08 September 2025 in 技术 • Tagged with WordPress, 双语网站, Polylang, 多语言, 网站搭建

🌍 多语言方案对比

1. WPML (WordPress Multilingual Plugin) - 付费,功能最强

  • 优点:功能完整,兼容性好,支持所有主题和插件
  • 缺点:需要付费($39+/年)
  • 适合:商业网站,预算充足

2. Polylang - 免费,推荐

  • 优点:免费,轻量,易用,兼容性好
  • 缺点:高级功能需要付费
  • 适合:个人网站,中小型项目

3. qTranslate-XT - 免费

  • 优点:完全免费,简单易用
  • 缺点:兼容性一般,更新不频繁
  • 适合:简单的双语需求

4. Weglot - 付费,自动翻译

  • 优点:自动翻译,无需手工维护
  • 缺点:需要付费,翻译质量一 …

Continue reading

WordPress 专业双语网站解决方案

Posted on Mon 08 September 2025 in 技术 • Tagged with WordPress, 多语言, WPML, Polylang, 网站建设

🌍 业界成熟方案对比

1. WPML (WordPress Multilingual Plugin) ⭐⭐⭐⭐⭐

  • 类型:付费插件($39-$159/年)
  • 优点
  • 最完整的多语言解决方案
  • 支持自动翻译和人工翻译
  • 完美的URL结构(/en/, /cn/)
  • 支持WooCommerce等插件
  • 专业的翻译管理界面
  • 缺点
  • 需要付费
  • 功能较多,初学者可能觉得复杂

2. Polylang ⭐⭐⭐⭐

  • 类型:免费版 + Pro版
  • 优点
  • 免费版功能已经很强大
  • 简单易用
  • 支持自定义URL结构
  • 与大多数主题兼容
  • 缺点
  • 某些高级功能需要Pro版
  • 需要手动配置较多

3. TranslatePress ⭐⭐⭐⭐

  • 类型:免费版 + 付费版
  • 优点
  • 可视化翻译界面
  • 前 …

Continue reading