Vahan Martirosyan,亚美尼亚埃里温的开发者
Vahan is available for hire
Hire Vahan

Vahan Martirosyan

Verified Expert  in Engineering

数据科学家和开发人员

Location
Yerevan, Armenia
Toptal Member Since
March 16, 2022

Vahan是一名数据科学家,拥有5年以上的经验,构建了多个端到端ETL管道,集成了来自多个来源的数据. 他擅长利用NLP的尖端工具, time series analysis, computer vision, 地理空间数据分析, network analysis, 并对数据进行表格式分析,满足项目需要. Vahan采用整体方法进行数据科学咨询,并喜欢深入了解其数据科学项目背后的商业环境.

Portfolio

Grata Inc
生成预训练变形(GPT), GPT...
Hxr Eq LLC
数据科学,生成预训练变压器(GPT)...
HODL Media Inc.
OpenAI,机器学习,OpenAI健身房...

Experience

Availability

Part-time

Preferred Environment

Ubuntu, Visual Studio Code (VS Code), Jupyter, MongoDB, Python, ChatGPT, Stable Diffusion, MVP Design, Real Estate, Insurance

The most amazing...

...我开发的项目使用了各种数据源和建模方式,包括NLP, CV, 以及传递社交信息的网络, political, and economic insights.

Work Experience

NLP Data Scientist

2022 - PRESENT
Grata Inc
  • 构建了一个NLP管道,其中包含使用GPT-3的合成数据集增强组件, 使用对比学习和变压器微调的少镜头主题分类, 还有一套语言启发式.
  • 构建了一个使用形态和依赖解析的关键字提取管道, 使用GPT-3进行合成数据增强, 使用对比学习和变压器的少射分类从公司描述中提取二元网络.
  • 构建并部署交互式仪表板,演示使用Steamlit和GCP的数据提取工具.
Technologies: GPT, 自然语言处理(NLP), 生成预训练变压器(GPT), Data Science, Python, PyTorch, Machine Learning, Statistics, 人工智能(AI), 生成预训练变压器3 (GPT-3), Deep Learning, APIs, Language Models, 数据处理自动化

Data Scientist

2022 - 2022
Hxr Eq LLC
  • 研究了主要电子商务网站用于搜索排名的模型和技术.
  • 就电子商务零售商在电子商务搜索排名中使用的模型和技术的业务含义进行咨询.
  • 就电子商务搜索排名策略的未来工作和发展提供咨询.
技术:数据科学, GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), Rankings, 生成预训练变压器3 (GPT-3), Python, Deep Learning, Machine Learning, 人工智能(AI), APIs, Language Models, 数据处理自动化

ML and OpenAI Developer

2022 - 2022
HODL Media Inc.
  • 开发了一种算法来过滤加密货币相关的新闻搜索结果.
  • 部署了一个利用多个数据检索api的管道, transformer-based架构, GPT-3 API在GCP中.
  • 就nlp驱动的信息检索解决方案的未来部署进行了咨询.
Technologies: OpenAI,机器学习,OpenAI健身房, 生成预训练变压器3 (GPT-3), Python, Deep Learning, 人工智能(AI), APIs, Web Crawlers, Scraping, Language Models, 数据处理自动化

NLP Engineer

2022 - 2022
天空尘埃情报B.V.
  • 开发了一个人工智能框架,利用GPT-3和其他基于变压器的神经网络架构来自动化电子邮件摘要, replies, and question answering.
  • 开发基于云的Office Outlook插件,利用人工智能框架实现电子邮件自动化.
  • 就产品开发和自然语言处理向团队咨询.
技术:自然语言处理(NLP), 生成预训练变形(GPT), GPT, 人工智能(AI), Knowledge Graphs, Deep Learning, 生成预训练变压器3 (GPT-3), Python, Machine Learning, APIs, Language Models, 数据处理自动化, MVP Design

Co-researcher

2021 - 2022
亚美尼亚美国大学
  • 开发了一个转换器驱动的NLP工具包,用于分析多语言新闻和社交媒体文本数据.
  • 建立了实时监控管道, analysis, 战略信息和心理作战(PSYOPS)的可视化.
  • 就战略信息行动与亚美尼亚政府协商.
Technologies: GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), Time Series Analysis, Research, Data Scraping, MongoDB, Transformers, Social Network Analysis, Consulting, Hugging Face, TensorFlow, PyTorch, NumPy, Pandas, 谷歌云平台(GCP), Data Science, Jupyter Notebook, Scikit-learn, BigQuery, Data Analytics, Predictive Modeling, Data Collection, Data Analysis, NoSQL, Charts, Databases, Microsoft Excel, Graphs, OpenAI Gym, OpenAI, Keras, Data Modeling, Time Series, Azure, Python, Deep Learning, Machine Learning, 人工智能(AI), APIs, Web Crawlers, Scraping, Language Models, 数据处理自动化, MVP Design

社交媒体数据质量评估国际顾问

2021 - 2022
联合国统计司
  • 开发了一种混合nlp驱动的方法来监控社交媒体数据质量.
  • 构建端到端ETL管道,使用先进的自动化机器人收集社交媒体数据. 它还利用最先进的基于变压器的体系结构进行文本和图像分类.
  • 构思并促进了一系列数据科学和自然语言处理主题的培训研讨会.
  • 为哥伦比亚国家行政部门(DANE)的社交媒体数据战略做出贡献.
  • 参加国际论坛,介绍和讨论所承担任务的成果和前景.
技术:自然语言处理(NLP), 生成预训练变形(GPT), GPT, Data Scraping, Computer Vision, Statistics, Data Visualization, Python, Deep Learning, Machine Learning, Consulting, Hugging Face, TensorFlow, PyTorch, NumPy, Pandas, 谷歌云平台(GCP), Data Science, Jupyter Notebook, Scikit-learn, Data Analytics, Predictive Modeling, Data Collection, Data Analysis, NoSQL, Charts, Databases, Microsoft Excel, Graphs, Microsoft Power BI, OpenAI Gym, OpenAI, Keras, Data Modeling, Time Series, Azure, 人工智能(AI), APIs, Web Crawlers, Scraping, Language Models, 数据处理自动化, MVP Design

Data Science Team Lead

2019 - 2022
开发署亚美尼亚国家可持续发展目标创新实验室
  • 为亚美尼亚语开发有监督和无监督语言模型, Russian, 在各种用例中使用英语.
  • Designed, implemented, 并管理不同部门的端到端数据科学项目, including tourism, labor, social services, etc.
  • 监督并应用新方法对亚美尼亚和其他国家的可持续发展目标(SDG)实施情况进行非常规数据分析.
  • 代表亚美尼亚出席关于数据科学促进国际发展的国际论坛.
技术:生成预训练变压器(GPT), 自然语言处理(NLP), GPT, Time Series Analysis, Computer Vision, ETL, EDA, Deep Learning, Machine Learning, Data Scraping, Geospatial Data, MongoDB, Data Visualization, Dashboards, Market Research & Analysis, Hugging Face, XGBoost, CatBoost, TensorFlow, PyTorch, NumPy, Pandas, 谷歌云平台(GCP), Data Science, Jupyter Notebook, 自然语言工具包(NLTK), Scikit-learn, Data Analytics, Predictive Modeling, Data Collection, Data Analysis, SQL, NoSQL, Charts, Databases, Microsoft Excel, Graphs, Microsoft Power BI, OpenAI Gym, OpenAI, Keras, Data Modeling, Time Series, Azure, Python, 人工智能(AI), APIs, Web Crawlers, Scraping, Language Models, 数据处理自动化, MVP Design

企业家和研究员

2019 - 2020
Impact Hub
  • 研究并建立了多元化的小农聚集收益分享方式模型,以降低小农在农业生产中的供应链风险.
  • 与农业利益相关者沟通, finance, 国际发展研究, develop, and promote the concept.
  • 开发了小农农业生产风险管理的新方法.
技术:风险模型, Supply Chain, International Trade, Entrepreneurship, Time Series Analysis, Research, NumPy, Pandas, Data Science, Jupyter Notebook, 自然语言工具包(NLTK), Scikit-learn, Data Analytics, Predictive Modeling, Data Collection, Data Analysis, Charts, Databases, Microsoft Excel, 商业智能(BI), Microsoft Power BI, Data Modeling, Time Series, Azure, 数据处理自动化, MVP Design

机器学习分析师

2018 - 2020
Ameriabank
  • 构建虚拟呼叫中心助理(聊天机器人)的自然语言处理模型.
  • 开发递归神经网络和卷积神经网络预测商品价格, 金融市场指标, and product sales.
  • 创建了新颖的Product2Vec和Customer2Vec模型来预测和预测客户流失.
技术:时间序列分析, Forecasting, Machine Learning, GPT, 自然语言处理(NLP), 生成预训练变压器(GPT), Chatbots, TensorFlow, NumPy, Pandas, Data Science, Jupyter Notebook, 自然语言工具包(NLTK), Scikit-learn, Data Analytics, Predictive Modeling, Data Collection, Data Analysis, SQL, Charts, Databases, Microsoft Excel, 商业智能(BI), Microsoft Power BI, Keras, Data Modeling, Time Series, Azure, Python, Deep Learning, 人工智能(AI), APIs, 数据处理自动化, MVP Design

Serviceman

2015 - 2017
亚美尼亚共和国国防部
  • 开发代码来分析和可视化战术、战略和管理数据.
  • 执行与炮兵侦察有关的各种任务, 与外国代表团合作, research, and speech–writing.
  • 由麻省理工学院、哈佛大学、牛津大学和剑桥大学的专家进行协调研究.
Technologies: Teamwork, Leadership, Python, Time Series Analysis, Project Management, NumPy, Pandas, Data Science, Jupyter Notebook, 自然语言工具包(NLTK), Scikit-learn, Data Analytics, Predictive Modeling, Data Collection, Data Analysis, Charts, Databases, Microsoft Excel, Data Modeling

AI4Mulberry

http://www.sdglab.am/en/projects
该项目旨在实现公民与政府机构之间通信分类的自动化,以提高亚美尼亚政府提供服务的运作效率和质量. 公民的书面交流按等级分类, 首先是关于各部, 然后是特定部门的部门, 最后是给定部门内的分支机构.

该项目的主要挑战是使用低资源语言和小型数据集进行监督学习. 我为克服这一挑战而设计的框架需要使用机器翻译和生成式自回归语言模型来增强数据集,用于释义生成和零采样分类,并对预训练的转换器(如XLM-Roberta)进行微调.

Travelinsights

http://www.travelinsights.ai/
Travelinsights.ai是亚美尼亚旅游业有史以来第一个实时数据分析工具. 该工具结合了旅行故事和自然语言处理来收集, analyze, 并根据Tripadvisor将亚美尼亚旅游业的情绪和话题可视化.com, Facebook.com, and Booking.com reviews.

我参与设计了该工具,为旅游部门的公共决策者提供实时可操作的情报和历史趋势数据,使决策更加以数据为基础,以证据为基础.

Edu2Work

http://edu2work.am/
我为Edu2Work的发展做出了贡献, 一个持续收集各种商业网站在线招聘公告的平台. 然后,它通过监督机器学习清理和标准化有关职位和技能要求的传入数据,并在交互式在线仪表板中可视化数据.

哥伦比亚国家行政部门

这个项目的目标是开发有效收集的工具, assess the quality of, 并分析来自社交媒体的非常规数据, 目的是深入了解哥伦比亚人民对歧视的感受.

我在这个项目中的职责包括开发一种混合nlp驱动的方法来监控社交媒体数据质量,构建一个端到端的ETL管道,该管道使用先进的自动化机器人收集社交媒体数据,并利用基于变压器的架构进行文本和图像分类.

该项目及从中收集的见解为哥伦比亚国家行政部门(DANE)的社交媒体数据战略做出了贡献.

Languages

Python, SQL

Libraries/APIs

NumPy, Pandas, Scikit-learn, XGBoost, CatBoost, TensorFlow, PyTorch, 自然语言工具包(NLTK), Keras

Tools

Microsoft Excel, Jupyter, Microsoft Power BI, BigQuery, OpenAI Gym

Paradigms

ETL,数据科学,商业智能,异步编程

Platforms

Jupyter Notebook, Ubuntu, Visual Studio Code (VS Code), 谷歌云平台(GCP), Azure

Storage

数据库,MongoDB, NoSQL

Other

自然语言处理(NLP), Data Scraping, Deep Learning, Machine Learning, EDA, Transformers, 人工智能(AI), Text Classification, Text Mining, Web Scraping, Dashboards, Data Analytics, Predictive Modeling, Data Collection, Data Analysis, Charts, Data Modeling, APIs, Web Crawlers, Scraping, Language Models, 数据处理自动化, MVP Design, GPT, 生成预训练变压器(GPT), Mathematics, Linear Algebra, Graph Theory, Mathematical Analysis, Microeconomics, Macroeconomics, Probability Theory, Statistics, Computer Vision, Data Visualization, Consulting, Time Series Analysis, Geospatial Data, Forecasting, Chatbots, Research, Social Network Analysis, Risk Models, Teamwork, Leadership, 生成预训练变压器3 (GPT-3), IT Project Management, Networks, Geospatial Analytics, Hugging Face, Graphs, OpenAI, Time Series, ChatGPT, Stable Diffusion, Real Estate, Environment, Economics, Financial Mathematics, 定量风险建模, Game Theory, Measure Theory, Supply Chain, International Trade, Entrepreneurship, Market Research & Analysis, History, Physics, English, Languages, Biology, Environmental Science, Art, Knowledge Graphs, Rankings

Industry Expertise

项目管理、保险

Frameworks

Flask

2013 - 2018

数学与经济学学士学位

伦敦大学学院| UCL -伦敦,英国

2008 - 2012

中等教育高中文凭

John F. 肯尼迪学院-柏林,德国

有效的合作

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring