ResNet参数

Python示例代码

    import torch
    import torchvision.models as models
    import torchvision.transforms as transforms
    from PIL import Image
    import inspect

    # 加载预训练的 ResNet-18 模型
    model = models.resnet18(weights=models.ResNet18_Weights.DEFAULT)
    model.eval()  # 设置为评估模式

    print("ResNet-18 文档:")
    print(inspect.getdoc(models.resnet18))
    print("\n" + "="*60 + "\n")

    # 分析每一层的参数量
    def analyze_resnet18_params(model):
        total_params = 0
        print(f"{'Layer Name':<25} {'Parameters':<12} {'Shape':<30} {'Description':<20}")
        print("-" * 90)
        
        # 卷积层1 (初始卷积)
        conv1 = model.conv1
        conv1_params = sum(p.numel() for p in conv1.parameters())
        total_params += conv1_params
        print(f"{'conv1':<25} {conv1_params:<12} {str(tuple(conv1.weight.shape)):<30} {'初始卷积层'}")

        # BN层1
        bn1 = model.bn1
        bn1_params = sum(p.numel() for p in bn1.parameters())
        total_params += bn1_params
        print(f"{'bn1':<25} {bn1_params:<12} {str(tuple(bn1.weight.shape)):<30} {'批归一化层'}")

        # 残差块
        layer_names = ['layer1', 'layer2', 'layer3', 'layer4']
        layer_descriptions = ['残差块1(2个基础块)', '残差块2(2个基础块)', '残差块3(2个基础块)', '残差块4(2个基础块)']
        
        for i, (layer_name, desc) in enumerate(zip(layer_names, layer_descriptions)):
            layer = getattr(model, layer_name)
            layer_params = 0
            
            # 每个layer包含多个BasicBlock
            for j, block in enumerate(layer):
                block_params = sum(p.numel() for p in block.parameters())
                layer_params += block_params
                total_params += block_params
                print(f"{f'{layer_name}[{j}]':<25} {block_params:<12} {'-':<30} {f'第{i+1}层第{j+1}个基础块'}")
            
            print(f"{f'{layer_name}_total':<25} {layer_params:<12} {'-':<30} {desc}")

        # 全连接层
        fc = model.fc
        fc_params = sum(p.numel() for p in fc.parameters())
        total_params += fc_params
        print(f"{'fc':<25} {fc_params:<12} {str(tuple(fc.weight.shape)):<30} {'全连接分类层'}")

        print("-" * 90)
        print(f"{'TOTAL':<25} {total_params:<12} {'-':<30} {'总参数量'}")
        
        return total_params

    # 执行分析
    total_params = analyze_resnet18_params(model)

    print("\n" + "="*60)
    print("ResNet-18 结构解释:")
    print("="*60)

    print("\n1. 网络结构概述:")
    print("   - ResNet-18 包含 18 个带权重的层（卷积层+全连接层）")
    print("   - 使用残差连接解决深层网络梯度消失问题")
    print("   - 总参数量约为 11.7M")

    print("\n2. 主要组件说明:")
    print("   - conv1: 初始卷积层，7x7卷积核，提取基础特征")
    print("   - bn1: 批归一化层，加速训练并提高稳定性")
    print("   - layer1-4: 4个残差块，每个包含2个基础块(BasicBlock)")
    print("   - 每个BasicBlock: 包含2个3x3卷积层和残差连接")
    print("   - fc: 全连接层，将特征映射到1000个分类类别")

    print("\n3. 参数量分布特点:")
    print("   - 大部分参数集中在全连接层(fc)")
    print("   - 卷积层参数相对较少但计算量大")
    print("   - 使用3x3小卷积核减少参数量")
    print("   - 残差连接不增加额外参数")

    print("\n4. 设计优势:")
    print("   - 残差结构使网络可以很深(18层)而不会梯度消失")
    print("   - 批量归一化提高训练稳定性")
    print("   - 全局平均池化减少全连接层参数")
ResNet参数

ResNet参数及可视化