十行代码实现会议纪要智能整理（录音-纪要）

weixin_41950947

715人浏览 · 2025-09-26 08:00:00

weixin_41950947 · 2025-09-26 08:00:00 发布

一、音频转文本

任务一、创建文件夹，上传音频

1、在根目录下创建文件夹“audio”

2、上传会议录音音频

任务二、安装必要的库

1、SpeechRecognition

中文名称：语音识别库

主要功能：

提供简单易用的接口，支持语音文件或麦克风输入的语音识别。
支持多种语音识别引擎（如 Google Web Speech API、Sphinx 等）。
识别语音中的内容并将其转换为文本。

使用方法：安装库：

pip install SpeechRecognition

代码示例：

import speech_recognition as sr

# 初始化识别器
recognizer = sr.Recognizer()

# 从音频文件中识别语音
with sr.AudioFile('example.wav') as source:
    audio_data = recognizer.record(source)
    text = recognizer.recognize_google(audio_data, language='zh-CN')
    print("识别结果:", text)

# 从麦克风中识别语音
with sr.Microphone() as source:
    print("请开始说话：")
    audio_data = recognizer.listen(source)
    text = recognizer.recognize_google(audio_data, language='zh-CN')
    print("识别结果:", text)

2、pyaudio

中文名称：音频处理库

主要功能：

提供对音频输入和输出的接口，可以录制和播放音频。
支持 WAV 文件录制、流式音频处理。

使用方法：安装库：

pip install pyaudio

代码示例：

import pyaudio
import wave

# 设置音频参数
FORMAT = pyaudio.paInt16
CHANNELS = 1
RATE = 44100
CHUNK = 1024
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"

audio = pyaudio.PyAudio()

# 开启音频流
stream = audio.open(format=FORMAT, channels=CHANNELS,
                    rate=RATE, input=True,
                    frames_per_buffer=CHUNK)

print("正在录音...")

frames = []
for _ in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
    data = stream.read(CHUNK)
    frames.append(data)

print("录音结束！")

# 停止音频流并保存文件
stream.stop_stream()
stream.close()
audio.terminate()

with wave.open(WAVE_OUTPUT_FILENAME, 'wb') as wf:
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(audio.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))

3、requests

中文名称：HTTP请求库

主要功能：

提供简单易用的接口，用于发送 HTTP 请求（GET、POST、PUT、DELETE 等）。
支持处理参数、文件上传、认证、会话和 Cookie。

使用方法：安装库：

pip install requests

代码示例：

import requests

# 发送 GET 请求
response = requests.get('https://api.example.com/data')
print("GET 请求响应:", response.json())

# 发送 POST 请求
payload = {'key1': 'value1', 'key2': 'value2'}
response = requests.post('https://api.example.com/submit', data=payload)
print("POST 请求响应:", response.text)

# 下载文件
file_url = 'https://example.com/file.zip'
response = requests.get(file_url)
with open('file.zip', 'wb') as file:
    file.write(response.content)
print("文件下载完成！")

任务三、加载音频文件并进行语音识别

import speech_recognition as sr

# 初始化识别器
recognizer = sr.Recognizer()

# 加载音频文件并进行语音识别
audio_file_path = r"audio/lfasr_涉政.wav"
with sr.AudioFile(audio_file_path) as source:
    audio_data = recognizer.record(source)
    text = recognizer.recognize_google(audio_data, language="zh-CN")

print(text)

二、创建文本整理智能体

任务一、在coze平台上创建文本整理智能体

1、登录coze平台（http://coze.cn）创建智能体

2、编写提示词

请按照以下要求，将输入的文本内容整理为会议纪要。格式严格按照以下结构：

整理后的会议纪要：

    a. 会议主题：
    [请明确会议的标题和主要目的]

    b. 会议日期和时间：
    [请提取并注明会议的具体日期和时间]

    c. 参会人员：
    [列出参加会议的所有人员的姓名或职位]

    d. 会议记录者：
    [请注明记录这些内容的人员的姓名或职位]

    e. 会议议程：
    [列出会议的所有主题和讨论点]

    f. 主要讨论：
    [根据议程逐一详细说明每个议题的讨论内容]

    g. 决定和行动计划：
    [列出会议中做出的所有决定，以及具体的行动计划、负责人和完成时间]

    h. 下一步打算：
    [列出需要在下一次会议中进一步讨论的问题或计划]

请确保输出格式与上述框架完全一致，并提供清晰、具体的内容。

3、调试后，发布智能体

任务二、获得授权密钥和智能体ID

1、获取授权密钥

2、获取智能体ID

打开智能体，复制url上的最后一串数字

三、调用智能体实现会议纪要工具

任务一、编写coze接口调用模块

任务二、调用API并传参

# 设置 API token 和 ID
coze.token = 'pat_wDjqtaPaXC7Dy7jgOjpsYE6iYyooyQF6Yn3p2RFrTJTm5JuE2y9ffLHGa5lyMhGw'
coze.id = '7454460727412146212'

# 确保传递的字符串格式正确
meeting = coze.ask(f"{text}")

任务三、运行程序，获得会议纪要

from LMAPI import coze
import speech_recognition as sr

# 初始化识别器
recognizer = sr.Recognizer()

# 加载音频文件并进行语音识别
audio_file_path = r"audio/lfasr_涉政.wav"
with sr.AudioFile(audio_file_path) as source:
    audio_data = recognizer.record(source)
    text = recognizer.recognize_google(audio_data, language="zh-CN")

# 设置 API token 和 ID
coze.token = 'pat_wDjqtaPaXC7Dy7jgOjpsYE6iYyooyQF6Yn3p2RFrTJTm5JuE2y9ffLHGa5lyMhGw'
coze.id = '7454460727412146212'

# 确保传递的字符串格式正确
meeting = coze.ask(f"{text}")

# 打印输出
print(meeting)

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

LangChain 基础对话链构建新手指南

每次都把完整提示词写在代码里，不优雅。而且如果你想用同样的模板去处理不同内容，就得反复写重复的代码。"请用{字数}字以内的中文总结以下内容：\n\n{内容}"# 填入变量prompt = template.format(字数="50", 内容="LangChain是一个用于开发由语言模型驱动的应用程序的框架...")("system", "你是一个{角色}，回答需要简洁专业。"),("human"

2048 AI社区

2026年AI写作工具推荐：从算法优化角度解读高质量内容生成机制

2026年AI写作工具竞争已转向算法优化，聚焦稳定生成高质量内容。本文对比五款国产工具的核心算法差异：蛙蛙写作采用"结构约束+记忆增强"系统，通义千问基于大模型自回归优化，讯飞星火侧重语义增强和行业对齐，WPSAI以文档结构驱动生成，秘塔写作猫专注语义重写优化。分析显示，蛙蛙写作在长文本稳定性和生成控制力上表现突出。行业趋势表明，AI写作正从单一模型生成转向融合LLM、RAG、