Sebastián Castaño
Verified Expert in Engineering
数据科学家和机器学习开发人员
Sebastián拥有机器学习和数据科学博士学位,在医学跨学科项目方面有十年的经验, banking, marketing, 消费产品, among others. 他的专长包括设计数据收集系统, 分析和建模复杂的数据, 开发和部署机器学习管道. 作为一个经验丰富的研究者和教育家, Sebastián不断为技术和非技术同事提供令人信服的数据驱动见解和直观工具.
Portfolio
Experience
Availability
首选的环境
Windows, Linux, Spyder, PyCharm, Jupyter Notebook, Scikit-learn, Visual Studio Code (VS Code), Git, Docker
The most amazing...
...我开发的项目是一个基于ml的, 优化帕金森病和特发性震颤患者脑刺激治疗的闭环系统.
Work Experience
Co-founder
Stealth Startup
- 共同创立了一家为IT团队开发知识管理框架的公司.
- 利用基于变压器的自然语言处理模型开发并实现了一个多领域语料库分析系统.
- 设计和部署AWS基础设施,为神经搜索引擎提供服务.
机器学习工程师
全球食品和饮料公司
- 作为MLOps团队的一员,为新的地域市场和产品系列建立并推出现有的媒体组合模型.
- Designed, implemented, 并为基于贝叶斯统计建模的媒体混合模型部署了PoC,作为ML R的成员&D team.
- 领导由五名机器学习工程师和数据科学家组成的团队. The team developed, benchmarked, productized, 并为营销团队部署了下一代媒体组合模式.
Consultant
D-fine
- 验证了一家大型德国银行的信用风险和会计模型.
- 在德甲球队对足球运动员的伤病预测和人才培养数据进行预测性和规范性的统计分析.
- 为一家大型欧洲银行部署数据管理系统.
- 开发MLOps管道, 包括神经网络的架构优化, 对于一个内部项目.
博士研究助理
弗莱堡大学
- 开发了第一个基于机器学习的, closed-loop, 脑深部电刺激系统在自由活动患者中的应用. 与这一成就相关的项目是在临床医生和行业伙伴的密切合作下进行的.
- 建立了数据驱动的适应性脑深部刺激作为大学的一个新的研究领域.
- 在同行评议的科学期刊上发表了7篇研究论文,并在机器学习领域的科学研讨会和会议上发表了10多篇论文, data science, and neuroscience.
- 支持计算机科学硕士项目的机器学习讲座5年,以练习、考试和辅导为概念. 该讲座的平均出席人数为每学期100人左右.
- 指导一个2-5人(有偿)的硕士研究助理团队完成实验室的辅助任务.
- 指导15名以上学生在实验室完成硕士和学士学位论文.
Research Assistant
哥伦比亚国立大学
- 作为唯一的讲师讲授模拟电子学课程. 除了准备讲座, exercises sheets, and exams, 我监督学生项目的执行.
- 指导一名(带薪)本科生助教讲授模拟电子学.
- 开发了神经信号源定位的新方法, 结果在同行评议的期刊上发表了一篇科学论文.
Experience
基于NLP方法的研究发现引擎
Key Activities
•实现一个PoC系统,该系统由一个发现引擎组成,用于使用大型语言模型进行机器学习研究.
•设计和部署服务于发现引擎的云基础设施.
•创建商业模式和市场策略.
•对50多名受访者进行用户发现和开发访谈.
消费类产品的媒体组合模型
Key Activities
•实施基于最新研究论文的学习模式.
•根据可用数据的特定属性定制模型.
•将模型部署到云上,供MLOps团队使用.
•利用来自业务部门的反馈反复改进模型.
•向业务部门的几个非技术利益相关者展示结果.
基于ml的特发性震颤患者适应性深部脑刺激系统
http://www.frontiersin.org/articles/10.3389/fnhum.2020.541625/fullKey Activities
•建立了我们在弗莱堡大学的研究实验室(大脑状态解码实验室)和华盛顿大学(生物机器人实验室)之间的合作.
•构思并开发底层机器学习, control, 以及数字信号处理方法.
•将算法部署在主机PC和患者神经刺激器的嵌入式系统上.
•执行数据收集实验.
•对收集的数据进行离线分析.
•撰写并编辑了同行评审出版物的最终手稿.
某足球队伤病数据分析
Key Activities
•准备和清理来自多个数据库的数据.
•对数据进行描述性和规范性分析.
•将结果呈现给所有利益相关者,包括非技术人员.
数据管理系统的部署
Key Activities
•配置和部署UAT和生产环境.
•为后端和前端实现了CI/CD管道.
从大脑信号中解码帕金森病症状
http://www.sciencedirect.com/science/article/pii/S2213158220302138Key Activities
•设计并执行数据收集实验.
•对数据进行预处理并进行探索性数据分析.
•构思并实现了新的ML方法.
•用收集到的数据和最先进模型的基准验证了新的ML方法, 包括深度卷积神经网络.
•应用AutoML对所有考虑的模型进行超参数优化.
•撰写并编辑了在同行评审期刊上发表的最终手稿.
神经科学中ML的数据增强框架
http://www.frontiersin.org/articles/10.3389/fninf.2019.00055/full我们应对了以下挑战:
•在使用数据驱动的方法分析大脑信号时,缺乏可用的数据.
•可用标签不可靠
•原始信号中的高水平噪声.
Key Activities
• Conceived the idea.
•执行数据分析.
•撰写了发表在同行评议期刊上的科学手稿.
Skills
Languages
Python, SQL, R, Java, c#
Libraries/APIs
Scikit-learn, Matplotlib, Pandas, NumPy, PyTorch, React, TensorFlow
Tools
Spyder, MATLAB, Git, Seaborn, Jupyter, AutoML, PyCharm, Excel 2010
Paradigms
数据科学,用户验收测试(UAT)
Platforms
Windows, Linux, Jupyter Notebook, Docker, JBoss EAP, 亚马逊网络服务(AWS), Visual Studio Code (VS Code)
Other
数字信号处理, Programming, Time Series Analysis, Linear Algebra, Machine Learning, Neuroscience, Deep Learning, Research, Technical Writing, Statistics, Statistical Methods, Data Analytics, Data Analysis, Data Engineering, Neural Networks, Statistical Modeling, Predictive Analytics, Writing & Editing, 统计分析, 人工智能(AI), Consulting, 分类算法, Probability Theory, 强化学习, Bayesian Statistics, Algorithms, Electronics, 自然语言处理(NLP), OpenAI, Text Processing, GPT, 生成预训练变压器(GPT), Circuit Design, Control Theory, Calculus, 机器学习操作(MLOps), Data Warehousing, CI/CD Pipelines, Generative Systems, 大型语言模型(llm), Business Planning, IT项目管理, 自然语言理解(NLU), Customer Research
Storage
数据库管理系统(DBMS)
Education
计算机科学博士
弗莱堡大学-德国弗莱堡
工程硕士学位
哥伦比亚国立大学-马尼萨莱斯,哥伦比亚
电子工程工程师学位
哥伦比亚国立大学-马尼萨莱斯,哥伦比亚