Flask文件上传优化：大文件分片上传与断点续传实现

一、为什么需要优化文件上传

在Web开发中，文件上传是一个常见的需求，尤其是当用户需要上传大文件时，传统的单次上传方式可能会遇到很多问题。比如，网络不稳定可能导致上传失败，服务器内存占用过高可能影响性能，甚至浏览器可能会因为文件过大而直接崩溃。

这时候，我们就需要一种更高效、更可靠的上传方式——分片上传和断点续传。简单来说，分片上传就是把一个大文件切成多个小块，然后一块一块地上传；断点续传则是在上传过程中如果中断了，下次可以从中断的地方继续上传，而不是重新开始。

二、Flask如何实现分片上传

Flask是一个轻量级的Python Web框架，非常适合快速开发Web应用。我们可以利用Flask结合前端技术（如JavaScript）来实现分片上传。

前端实现分片上传

前端主要负责将文件切分成多个小块，并使用Ajax逐个上传。以下是一个简单的JavaScript示例：

// 选择文件后触发上传
document.getElementById('fileInput').addEventListener('change', function(e) {
    const file = e.target.files[0];
    const chunkSize = 1024 * 1024; // 每块1MB
    const totalChunks = Math.ceil(file.size / chunkSize);
    let currentChunk = 0;

    // 分片上传函数
    const uploadChunk = (start, end) => {
        const chunk = file.slice(start, end);
        const formData = new FormData();
        formData.append('file', chunk);
        formData.append('chunkIndex', currentChunk);
        formData.append('totalChunks', totalChunks);
        formData.append('fileName', file.name);

        fetch('/upload', {
            method: 'POST',
            body: formData
        }).then(response => response.json())
          .then(data => {
              currentChunk++;
              if (currentChunk < totalChunks) {
                  const nextStart = currentChunk * chunkSize;
                  const nextEnd = Math.min(nextStart + chunkSize, file.size);
                  uploadChunk(nextStart, nextEnd); // 继续上传下一块
              } else {
                  console.log('上传完成！');
              }
          });
    };

    // 开始上传第一块
    uploadChunk(0, Math.min(chunkSize, file.size));
});

后端Flask接收分片

Flask需要接收前端传来的分片数据，并保存到临时目录。以下是Flask的代码示例：

from flask import Flask, request, jsonify
import os

app = Flask(__name__)
UPLOAD_FOLDER = 'temp_uploads'
os.makedirs(UPLOAD_FOLDER, exist_ok=True)

@app.route('/upload', methods=['POST'])
def upload_chunk():
    file = request.files['file']
    chunk_index = int(request.form['chunkIndex'])
    total_chunks = int(request.form['totalChunks'])
    file_name = request.form['fileName']

    # 保存分片到临时文件
    temp_file_path = os.path.join(UPLOAD_FOLDER, f'{file_name}.part{chunk_index}')
    file.save(temp_file_path)

    # 如果是最后一个分片，合并所有分片
    if chunk_index == total_chunks - 1:
        final_path = os.path.join(UPLOAD_FOLDER, file_name)
        with open(final_path, 'wb') as final_file:
            for i in range(total_chunks):
                part_path = os.path.join(UPLOAD_FOLDER, f'{file_name}.part{i}')
                with open(part_path, 'rb') as part_file:
                    final_file.write(part_file.read())
                os.remove(part_path)  # 删除临时分片

        return jsonify({'status': 'success', 'message': '文件上传完成！'})

    return jsonify({'status': 'success', 'message': '分片上传成功！'})

if __name__ == '__main__':
    app.run(debug=True)

三、如何实现断点续传

断点续传的核心是记录已经上传的分片，下次上传时跳过这些分片。我们可以通过前端记录已上传的分片索引，或者后端存储上传状态来实现。

前端记录上传状态

前端可以在本地存储（如localStorage）中记录已上传的分片：

// 在上传之前检查哪些分片已经上传过
const uploadedChunks = JSON.parse(localStorage.getItem(file.name) || '[]');

const uploadChunk = (start, end) => {
    if (uploadedChunks.includes(currentChunk)) {
        currentChunk++;
        if (currentChunk < totalChunks) {
            const nextStart = currentChunk * chunkSize;
            const nextEnd = Math.min(nextStart + chunkSize, file.size);
            uploadChunk(nextStart, nextEnd);
        }
        return;
    }

    // 上传逻辑...
    // 上传成功后记录
    uploadedChunks.push(currentChunk);
    localStorage.setItem(file.name, JSON.stringify(uploadedChunks));
};

后端存储上传状态

更可靠的方式是让后端存储上传状态，比如使用Redis记录已上传的分片：

import redis

redis_client = redis.StrictRedis(host='localhost', port=6379, db=0)

@app.route('/upload', methods=['POST'])
def upload_chunk():
    file_name = request.form['fileName']
    chunk_index = int(request.form['chunkIndex'])

    # 检查是否已经上传过
    if redis_client.hexists(file_name, chunk_index):
        return jsonify({'status': 'skipped', 'message': '分片已上传，跳过'})

    # 保存分片...
    redis_client.hset(file_name, chunk_index, 'uploaded')
    return jsonify({'status': 'success', 'message': '分片上传成功！'})

四、应用场景与技术优缺点

应用场景

大文件上传：如视频、大型文档等。
弱网环境：网络不稳定时，分片上传可以提高成功率。
云存储服务：许多云存储服务（如AWS S3）支持分片上传。

技术优点

提高上传成功率：即使部分分片失败，也可以重试，而不是重新上传整个文件。
减少服务器压力：分片上传可以降低单次请求的内存占用。
支持断点续传：用户体验更好，尤其是大文件上传时。

技术缺点

实现复杂：相比普通上传，需要额外处理分片逻辑。
存储管理：需要管理临时分片文件或上传状态。

注意事项

分片大小选择：太小会增加请求次数，太大会降低分片上传的优势。
清理临时文件：上传完成后要及时清理临时文件，避免占用磁盘空间。
安全性：确保上传的文件不会被恶意利用，比如限制文件类型、检查文件内容等。

五、总结

通过分片上传和断点续传，我们可以显著提升大文件上传的效率和可靠性。Flask作为后端框架，结合前端技术，可以轻松实现这一功能。虽然实现起来比普通上传复杂一些，但对于用户体验和系统稳定性来说，是非常值得的。

如果你正在开发一个需要处理大文件上传的应用，不妨试试这种方案，相信它会给你带来更好的效果！

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。