-->
Save your seat for Streaming Media NYC this May. Register Now!

Backward Design for Educational Video Production

Article Featured Image

Over the past 15 years, 软件可访问性已经从一个小众的专业发展成为一个主流的期望. Until around 2010, believe it or not, 对于一名法定失明的学生或员工来说,在完成相同的任务时使用与同龄人完全不同的软件,这并不奇怪. Now, 随着通用设计运动的成功以及HTML和其他技术标准的提高, 这种迁就往好了说是采购方面的严重失败,往坏了说是一种非法歧视. 软件开发人员在前端开发的易访问性问题和基本概念(如标记控制元素和向辅助技术(屏幕阅读器)报告状态更改)方面接受了培训,这些都是专业开发人员代码测试过程的一部分. Despite this progress, 两种截然不同的力量正在旋转,它们有可能阻碍技术更好地包容残疾人的趋势.

The more short-term of those forces is the debate over “return-to-office.“自2020年以来,同步视频会议平台的大规模采用证明,在任何地方都可以参加商务会议. 而以前,在没有电梯的老旧建筑里,坐轮椅的人可能会被排除在外——不管是不是有意为之, that is no longer the case: either bring them in over Zoom, find a better location, or prepare for expensive and unflattering litigation. 许多残疾员工了解到,由于这些限制,他们被排除在很多决策之外,他们会竭尽全力地争取在完全远程为他们提供公平竞争环境的情况下,保持他们所享受的包容性. Strictly imposing return-to-office policies can lead to a perception of unfair, 对需要提供便利的残疾雇员的差别待遇或为避免此类冲突而采取的歧视性雇用政策.

对通用设计和更好的技术可访问性趋势的另一个威胁是大语言模型(llm)的出现。. I discussed the importance of LLMs in this year’s State of Education Video (go2sm.com/edstate), 他认为基于法学硕士的ChatGPT是一个比我们以前看到的平庸写作有很大改进的生成器,并且令人印象深刻地展示了我们在自然语言提示的软件解释方面取得了多大的进展. OpenAI为在线视频行业发布的更令人兴奋的法学硕士产品是Whisper语音转文本引擎. 在写完这些之后,GPT-4模型推出了,生成了比普通文本更好的文本. Whisper仍然是一个非常令人兴奋的工具,“为什么”支持这一点.

Before Whisper, Mozilla基金会的DeepSpeech是我希望能够成功的开源语音转文本引擎之一. Back in 2018, 我们通过实例讨论了语言模型在语音到文本问题中的重要性 Autumn Aided Cap Shins. 自动字幕的语音识别准确性的限制因素是预测正在说什么词的能力, a task performed by inference against a language model. DeepSpeech was constructed atop Mozilla’s Common Voice language database, 一个道德上纯粹的数据集,因为它的所有内容都是自愿提供的:目前是3,209 hours of speech data. Whisper的数据集是从互联网上抓取的,其语音数据量是前者的211倍. With such a larger language model, Whisper dramatically outperforms DeepSpeech.

Whisper赖以建立的法学硕士在伦理上并不像DeepSpeech那样完美无瑕. 关于ChatGPT只是一个剽窃引擎——基于从人们在互联网上分享的创意写作中窃取的语言模型生成文本的观察同样适用于Whisper(尽管我认为Whisper在提供准确的视频字幕方面提供了大量的公共利益)。. 反弹将是人们如何试图阻止建立法学硕士的公司获取他们的创造性成果. Proposals I’ve seen include a more toothful robots.txt type of solution. 但是,让互联网上的文字和视频更难被机器阅读(以及辅助技术)获取,是另一个对残疾人造成严重后果的解决方案. For educational video, 保护教师知识产权和学生隐私的解决方案是严格的内容安全:更好地保护视频(和字幕)访问的平台在该领域脱颖而出.

Streaming Covers
Free
for qualified subscribers
Subscribe Now Current Issue Past Issues
Related Articles

WCAG 2.2, Web Content Accessibility Standards, and You

Instead of a patchwork of accessibility standards for California, Illinois, Europe, and everywhere else, 当前的标准是由来自业界的广泛专家制定的,并由万维网联盟(W3C)作为Web内容可访问性指南(WCAG)发布。.

An Impending Accessibility Backlash

软件开发人员在前端开发的易访问性问题和基本概念(如标记控制元素和向辅助技术(屏幕阅读器)报告状态更改)方面接受了培训,这些都是专业开发人员代码测试过程的一部分. Despite this progress, 两种截然不同的力量正在旋转,它们有可能阻碍技术更好地包容残疾人的趋势.

Gear for the HyFlex Teaching and Learning Space

设计混合教室或会议空间的游戏名称是平衡远程和本地观众的包容性,同事有时将其称为“缩放者”和“房间者”," respectively. Here's a look at some gear that can help you achieve that balance.

Educators Need Resources That Simulate the Digital Divide

随着越来越多的学习材料上线,教育工作者需要确保所有学生都能访问. Learn about programs that show the limits of poor-quality networks.

Writing Text for Video: Did Someone Say 'Autumn Aided Cap Shins'?

Maybe, but they probably said "automated captions.“制作可靠的字幕是一项挑战,但教育视频迫切需要它.