轉換文章內容成為excel 檔案的時候
發生的錯誤
網路上查都好像是跟圖片有關的錯誤
後來才確認是 emoji 的問題
文章裡有出現
🙋♀️🙋♀️🙋♀️
這種東西
SQL:
SQL 好像也沒辦法完美的取代 ( 如果有辦法對準是哪個字元就可以 但如果是一個字串好像會無法取代)
只有剛好對到那個字元開頭時才能換
NCHAR(65039) NCHAR(8205)
Select TOP 10
Replace(SUBSTRING(content,10,15),NCHAR(65039) ,'XX') , ---HongKong️️️🙋♀️怎
REPLACE(SUBSTRING(content,17,8),NCHAR(65039),'OO') ---OO怎
FROM [Table]
C#
最後回到C#來處理
首先用 把string .ToArray() 變成char
找出字元後 轉成 int 來確認要怎麼表達這個 char
最後結果就變成>>
Convert.ToInt32(Table.Rows[0]["Content"].ToString().ToArray());
之後直接變成 char去取代
row["mycolumn"].ToString().Replace((char)65039, ' ').Replace((char)8205, ' ');
然後就暫時 沒錯誤了
只是這網站一直再更新
https://emojipedia.org/unicode-12.0/
所以未來可能還會有新的問題
目前還不知道甚麼快速的解法