音视频开发

音视频开发

最近更新

  • #棋盘效应 解决办法列举

    棋盘效应主要出现在反卷积部分,因为要从高阶描述中构建图像,先描绘粗糙的图像然后再构造细节。解决办法:步长为1的反卷积层 上采样:确保反卷积核的大小可以被步长整除;从卷积操作中分离出对卷积后更高分辨率的特征图上采样来计算特征...

    2021-12-05音视频开发【】

    阅读更多
  • 毕业设计:题目:基于stm32的语音识别 - 单片机 嵌入式 物联网 语音识别

    音视频开发毕业设计:题目:基于stm32的语音识别 - 单片机 嵌入式 物联网 语音识别

    1 项目目标项目最终实现功能: 用户说出指定的语音,硬件系统(由STM32和LD3320构成)能识别并显示在LCD液晶屏上,并触发预设的报警电路(由蜂鸣器和LED灯组成),还开发了对应的上位机(运行在PC电脑上),上位机可以显示硬件系统的状态,也可以控制其状态。2 项目背景意义首先,我们所开发的语音识别报警监控系统可以解放工厂员工的双手,让他们通过说出语音即可对设备进行控制,更方便也更快捷。其次,当现场的工作人员正忙于操纵设备,无法腾出手来发出警报,或者当他们距离报警系统较远,无法手动发出警报,可以

    2021-12-05音视频开发【】

    阅读更多
  • 对抗攻击常见方法汇总

    音视频开发对抗攻击常见方法汇总

    将常见的对抗样本攻击方法汇总,并给出学习链接。

    2021-12-05音视频开发【】

    阅读更多
  • 基于人脸的常见表情识别 Task02笔记

    音视频开发基于人脸的常见表情识别 Task02笔记

    基于人脸的常见表情识别——数据获取与整理项目背景对于很多初⼊深度学习计算机视觉领域的朋友来说,当前开源资料⾮常多,但有时候难以适从,其中很多资料都没有包含完整的项⽬流程,⽽只是对某个流程的部分截取,对能⼒的锻炼不够。图像分类是整个计算机视觉领域中最基础的任务,也是最重要的任务之⼀,最适合拿来进⾏学习实践。为了让新⼿们能够⼀次性体验⼀个⼯业级别的图像分类任务的完整流程,本次我们选择带领⼤家完成⼀个对图片中⼈脸进⾏表情识别的任务。数据获取很多实际项⽬我们不会有现成的数据集,虽然可以通过开源数据集获

    2021-12-05音视频开发【】

    阅读更多
  • 音视频技术是否成为Android新主流?6年音视频技术专家带你解密……

    音视频开发音视频技术是否成为Android新主流?6年音视频技术专家带你解密……

    一、背景:以高速度、泛在网、低功耗(设备端)、低时延、万物互联、重构安全为特点的5G技术使直播,短视频行业相关业务发展迅猛。远程会议、工作、学习,线上教育……甚嚣尘上,进行的如火如荼。抖音等短视频APP更是为音视频的火浇上了一瓢油。5G的浪潮全面袭来,其实为Android开发者带来了一个十分强劲的风口:音视频开发。自从2020年开始,远程会议、在线办公、教育,等项目开发需求持续激增,某音、某手等短视频App更是为音视频开发大力助燃。NDK 技术几乎已经成为Android开发必不可少的一个技能,虽说不是

    2021-12-05音视频开发【】

    阅读更多
  • 60、在Visual Studio 2019 环境下,使用C#调用C++生成的dll实现yolov5的图片检测

    音视频开发60、在Visual Studio 2019 环境下,使用C#调用C++生成的dll实现yolov5的图片检测

    基本思想:写了一个简单的c#调用c++的dll库,完成yolov5检测图片的分类一、创建一个c++工程,详细的构建和配置环境就不详细累述了,贴代码吧,导入opencv和ncnn库即可,因为需要考虑使用C#调用,所以改的代码尽量迎合C#调用的风格main.cpp#include "connect.h" int main(int argc, char** argv){ cv::Mat image = cv::imread("F:\\sxj\\pred

    2021-12-05音视频开发【】

    阅读更多
  • SDL播放PCM音频数据

    SDL播放PCM音频数据1.PCM简介   PCM(Pulse CodeModulation,脉冲编码调制)音频数据是未经压缩的音频采样数据裸流,它是由模拟信号经过采样、量化、编码转换成的标准数字音频数据。描述PCM数据的6个参数:  1.Sample Rate : 采样频率。8kHz(电话)、44.1kHz(CD)、48kHz(DVD)。  2.Sample Size : 量化位数。通常该值为16-bit。   3.Number of Channels : 通道个数。常见的音频有立体声(st

    2021-12-05音视频开发【】

    阅读更多
  • 使用霍夫直线变换做直线检测

    霍夫直线变换cv2.HoughLines(image, rho, theta, threshold, lines, sen, stn, min_theta, max_theta)cv2.HoughLines()。返回值就是极坐标表示的直线(ρ, θ)。ρ 的单位是像素,θ 的单位是弧度。def line_detect_possible_demo(): """使用霍夫直线变换做直线检测""" img_path = './line.pn

    2021-12-05音视频开发【】

    阅读更多
  • Android 视频采集

    书接上回,上一篇文章说了怎么播放对端 flv 文件流,这一回讲一讲怎么显示本地的视频画面,以及本地音视频内容的采集。视频采集和本地渲染都是在 explorer-device-video 这个模块中实现的。示例源码下载本地视频采集视频采集依赖了 RecordThread 这个类,这就是一个采集线程,主要就是通过 MediaCodec 对采集到音视频进行编码,编码方式是 H264(H265 的编码格式采集粗来的无法正常播放)public class RecordThread extends Thread

    2021-12-05音视频开发【】

    阅读更多
  • #卷积边缘问题处理 原理+代码

    卷积需要边缘化处理的原因:图像卷积的时候边界像素,不能被卷积操作,原因在于边界像素没有完全跟kernel重叠,所以当3x3滤波时候有1个像素的边缘没有被处理,5x5滤波的时候有2个像素的边缘没有被处理。代码实现:def conv2d(input_, output_dim, d_h=2, d_w=2 conv_filters_dim=4, use_bias=True, pad=0): """ Wrapper of convolutional ope..

    2021-12-05音视频开发【】

    阅读更多
  • python pillow 扩展图片增强

    音视频开发python pillow 扩展图片增强

    import osimport timefrom PIL import Image,ImageChops,ImageEnhanceimport matplotlib.pyplot as pltimport numpy as npimg = Image.open(r"C:\Users\xiahuadong\Pictures\风景\陆家嘴1.jpg")plt.imshow(img)​​img1 = img.transpose(Image.FLIP_LEFT_RIGHT) # 左

    2021-12-04音视频开发【】

    阅读更多
  • Google Earth Engine(GEE)——利用DEM数据划分100m等高线绘制青藏高原等高线

    我们利用NASA的DEM数据绘制等高线在GEE中MAP上进行展示:1.加载DEM影像2.添加一个点作为展示影像的中心点3.建立一个时间序列作为DEM的高度,和设置切片(这个就相当于切片DEM,每100米展示一层等高线)4.通过遍历实现一圈圈等高线的函数5.最后将影像镶嵌在一起即可此次需要用到的函数:ee.Kernel.gaussian(radius,sigma,units,normalize,magnitude)Generates a Gaussian kernel ...

    2021-12-04音视频开发【】

    阅读更多
  • face-recognition多人脸识别实时检测代码实例加精细化讲解

    import cv2import numpy as npimport face_recognitionname1 = cv2.imread("name1.jpg")name2 = cv2.imread("name2.jpg")name1_RGB = name1[:, :, ::-1]name2_RGB = name2[:, :, ::-1]name1_face = face_recognition.face_locations(name1_RGB)name2_fac

    2021-12-04音视频开发【】

    阅读更多
  • seaborn将图例放置在图像外部并使用move_legend函数将图例(legend)放置在图像的顶部、且单行展开显示

    seaborn将图例放置在图像外部并使用move_legend函数将图例(legend)放置在图像的顶部、且单行展开显示目录seaborn将图例放置在图像外部并使用move_legend函数将图例(legend)放置在图像的顶部并单行展开显示#seaborn会根据当前数据的布局自动匹配最佳的图例位置#seaborn使用move_legend函数将图例(legend)将图例放置在图像的顶部并单行展开显示#seaborn会根据当前数据的布局自动匹配最佳的图例位置import .

    2021-12-04音视频开发【】

    阅读更多
  • 寻找模型最优参数、多模型交叉验证、可视化、指标计算、多模型对比可视化(系数图、误差图、混淆矩阵、校正曲线、ROC曲线、AUC、Accuracy、特异度、灵敏度、PPV、NPV)

    使用randomsearchcv寻找模型最优参数、多模型交叉验证、可视化、指标计算、多模型对比可视化(系数图、误差图、classification_report、混淆矩阵、校正曲线、ROC曲线、AUC、Accuracy、特异度、灵敏度、PPV、NPV)目录使用randomsearchcv寻找模型最优参数、多模型交叉验证、可视化、指标计算、多模型对比可视化(系数图、误差图、classification_report、混淆矩阵、校正曲线、ROC曲线、AUC、Accuracy、特异度、灵敏度、PPV、

    2021-12-04音视频开发【】

    阅读更多
  • NMS非极大值抑制

    音视频开发NMS非极大值抑制

    NMS非极大值抑制

    2021-12-04音视频开发【】

    阅读更多
  • 毕设题目:Matlab通信

    1 案例背景文章针对无线信号经过信道时,由于多径干扰和多普勒频偏的影响,导致符号间存在码间干扰,造成误码率上升的缺点,提出一种基于OFDM信号无线通信方案,该方案采用多路并行的正交子载波进行基带信号调制,从而使系统码率下降,符号周期延长,有效的抵抗了多径的干扰,从而提高系统的性能。所以本文提出的基于OFDM信号无线通信方案的设计与仿真具有重大意义。2 现成案例(代码+参考文献)1. 【OFDM通信】基于matlab OFDM通信系统仿真【含Matlab源码 315期】2. 【扩频通信】基于matla

    2021-11-30音视频开发【】

    阅读更多
  • Python+OpenCV Canny滑动条调参

    音视频开发Python+OpenCV Canny滑动条调参

    初学图像处理,肯定调什么去噪,滤波,边缘检测的各种阈值调烦了,本文将利用cv库滑动条对Canny边缘检测进行实时调参,方便调参

    2021-11-30音视频开发【】

    阅读更多
  • VS2019中C++配置OpenCV

    音视频开发VS2019中C++配置OpenCV

    环境OpenCV版本:OpenCV - 4.5.4IDE:VS2019 Communtity教程OpenCV的下载以及解压下载最新的 OpenCV 安装包,搜索OpenCV,点击Release,可以找到最新的版本,进入之后可以根据不同的系统下载对应的版本[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传下载完成之后双击对其进行解压,注意这里解压的路径可以直接选择盘符,而不需要再选择一个子目录,解压时这里会自动生成一个opencv的子目录(我这里有多添加了一个OpenC

    2021-11-30音视频开发【】

    阅读更多
  • 总结各种神经网络的用处

    音视频开发总结各种神经网络的用处

    总结各种神经网络的用处深度神经网络DNN卷积神经网络CNN生成对抗网络GAN循环神经网络RNN深度神经网络DNN深度神经网络是深度学习的基础,也是最普通的神经网络模型,由一层输入层,多层隐藏层,一层输出层构成,一般用于普通的数据预测。参考链接:https://zhuanlan.zhihu.com/p/29815081卷积神经网络CNN卷积神经网络是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,可以应用于 语音识别 、图像处理和图像识别等领域。参考链接:https://z

    2021-11-30音视频开发【】

    阅读更多
  • Python之fastai:fastai库的简介、安装、使用方法之详细攻略

    Python之fastai:fastai库的简介、安装、使用方法之详细攻略目录fastai库的简介fastai库的安装fastai库的使用方法1、计算机视觉分类2、计算机视觉分割fastai库的简介 Fastai使用现代最佳实践简化了快速和准确的神经网络训练。fastai 是一个深度学习库,它为从业者提供高级组件,可以快速轻松地在标准深度学习领域提供最先进的结果,并为研究人员提供可以混合和匹配构建的低级组件新方法。它旨在做到这两件事...

    2021-11-30音视频开发【】

    阅读更多
  • Python之youtube_dl:youtube_dl库的简介、安装、使用方法之详细攻略

    Python之youtube_dl:youtube_dl库的简介、安装、使用方法之详细攻略目录youtube_dl库的简介youtube_dl库的安装youtube_dl库的使用方法1、基础使用方法youtube_dl库的简介 它是一款开源免费但功能强大的视频下载工具。youtube_dl库是利用命令行程序下载视频从YouTube.com和其他视频网站。youtube-dl 虽然名字带有 Youtube,但实际上可以支持许多视频网...

    2021-11-30音视频开发【】

    阅读更多
  • 图像处理-投影图像恢复仿射特性2

    音视频开发图像处理-投影图像恢复仿射特性2

    前言在我的上一篇笔记中记录了有关投影图像恢复仿射特性,去除投影畸变的方法,主要是通过找平行线的交点来完成的。这里将使用另外一种方法来找vanishing point,进而确定infinite line。这种方法更加适合类似例子中的这种比较整齐有规律的图像。原理对于一位空间(一条直线上)的射影几何,点的齐次坐标为(x1,x2),点的投影变换公式为:投影变换矩阵H有三个自由度,每对点映射可以提供一个约束条件,即一个方程,因此只要找到三对点映射,建立三元一次方程组,就能求解出H,进而使用上面的投影变换公

    2021-11-30音视频开发【】

    阅读更多
  • 【深度学习】TF2.0

    内容主要是关于Tensorflow2.0 的学习记录

    2021-11-30音视频开发【】

    阅读更多
  • RGB等图片的图像插值算法纯python实现

    音视频开发RGB等图片的图像插值算法纯python实现

    放大的基本思想:第一步:将目标图像进行缩小到原图像的尺寸,虚拟的将二者进行对重叠在一起,这样目标图像上面的像素点就和原图像上面的像素点并不是一一对应的。第二步:将目标图像与原图像的像素点进行建立一个映射关系,这个像素点的映射关系不是单一的像素映射,因为我们把图片存放在三维数组里面,所以我们在得到图像的像素点时,我们是通过索引数组的`高和宽`,在坐标系中对应的就是`x坐标、y坐标`.怎样建立映射关系呢?本文中用到了前面三种插值算法,并且进行了代码实现,代码仅供参考,大佬随便看一下小菜鸡的就行了。

    2021-11-30音视频开发【】

    阅读更多

本栏推荐

站点信息

  • 文章统计1073739篇文章
  • 浏览统计33957次浏览
  • 评论统计2个评论
  • 标签管理标签云
  • 统计数据:统计代码
  • 微信公众号:扫描二维码,关注我们