朋友发过来的信件,全都是
Hi, Sorry for writing back late. 数据丢了就丢了吧,以后小心点就ą
59;了,你应该把那些重要的东东刻下
这个样子,怎么办?让他重写,估计谁也没有这个耐心,只好自己捉摸一下了。
判定问题:看这段文本可以猜出每个&#xxxxx;都是一个字符的某种编码,在google上搜了一把,果然发现这些都是unicode码。
分析问题:unicode无非就是2个字节存储一个字符,所以只要将这些unicode码当作16位数存在一个宽字符缓存中,显示就行了。 还要考虑windows一般显示字符都要转换成mutibyte方式,所以还要用个api函数:WideCharToMultiByte。 实现: code + debug --> ok! 朋友的长信被“解密”了。
现在和大家分享快乐(没有优化,不好意思了):
#define _UNICODE // IMPORTANT!!
// convert from one wide char to mutibyte char[] char* Convert( wchar_t wc, char* lpDest ) { // construct wchar string wchar_t strScr[2]; strScr[0] = wc; strScr[1] = L'\0';
// lpDest must a char string with 3 byte, and lpDest[2] == '\0' assert( 0 == lpDest[2] );
int iRet = WideCharToMultiByte( CP_ACP, // codepage 0, // dwFlags strScr, // lpWideCharStr -1, // cchWideChar lpDest, // lpMutiByteStr 3, // cchMutiByte NULL, // lpDefaultChar NULL // lpUsedDefaultChar );
int iError = GetLastError(); switch(iError) { case ERROR_INSUFFICIENT_BUFFER: break; case ERROR_INVALID_FLAGS: break; case ERROR_INVALID_PARAMETER: break; default: return lpDest; } return NULL; }
// from unicode string to normal string CString ParseConvert( CString& szSrc ) { CString szDest = "";
int cLength = szSrc.GetLength(); char cDestChar[] = "??"; for( int i=0 ; i < cLength; i ++ ) { if( szSrc[i] == '&' && szSrc[i+1] == '#' ) // a unicode char start { int iCount = 0; char szWC[10] ; memset( szWC, 0, 10 ); i += 2; while( szSrc[i] != ';' ) { szWC[iCount] = szSrc[i]; iCount++; i++; } int wc = 0; sscanf( szWC, "%d", &wc ); szDest += Convert( wc, cDestChar ); } else { szDest += szSrc[i]; } } return szDest; }
void CDecodeDlg::OnButton1() { CFileDialog dlg(TRUE); CString szFileName; if( dlg.DoModal() == IDOK ) { szFileName = dlg.GetPathName(); } else return;
CStdioFile file; file.Open( szFileName, CFile::modeRead | CFile::typeText );
CString szBuf, szLine;
while( file.ReadString( szLine ) ) { szBuf += szLine; szBuf += "\n"; } file.Close();
// try it MessageBox( ParseConvert( szBuf ) );
}
mailto: [email protected] 
|