2 1

Dongyoon Hahm

Hahmdong

https://hahmdy.github.io

HahmDY

AI & ML interests

AI Safety

Recent Activity

updated a model about 21 hours ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

published a model about 21 hours ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

updated a model about 23 hours ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

View all activity

Organizations

None yet

updated a model about 21 hours ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

4B • Updated about 21 hours ago • 21

published a model about 21 hours ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-emoji-p10-p100

4B • Updated about 21 hours ago • 21

updated a model about 23 hours ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

4B • Updated about 22 hours ago • 45

published a model about 23 hours ago

Hahmdong/RMOOD-qwen3-4b-it-skywork-bias-analysis-markdown-p10-p100

4B • Updated about 22 hours ago • 45

upvoted a paper 3 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 6 days ago • 2

submitted a paper to Daily Papers 3 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 6 days ago • 2

authored a paper 4 days ago

Alignment Tampering: How Reinforcement Learning from Human Feedback Is Exploited to Optimize Misaligned Biases

Paper • 2605.27355 • Published 6 days ago • 2

updated a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased150-to-good50

3B • Updated 19 days ago • 18

published a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased150-to-good50

3B • Updated 19 days ago • 18

updated a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased100-to-good100

3B • Updated 19 days ago • 18

published a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased100-to-good100

3B • Updated 19 days ago • 18

updated a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased50-to-good150

3B • Updated 19 days ago • 17

published a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-doubledatarm-biased50-to-good150

3B • Updated 19 days ago • 17

updated a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean

3B • Updated 19 days ago • 18

published a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean

3B • Updated 19 days ago • 18

updated a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean-length-0.9

3B • Updated 19 days ago • 16

published a model 19 days ago

Hahmdong/RMOOD-llama3.2-3b-it-skywork-rm-clean-length-0.9

3B • Updated 19 days ago • 16

updated 3 models 19 days ago

Dongyoon Hahm

AI & ML interests

Recent Activity

Organizations

Hahmdong's activity